www.wikidata.de-de.nina.az
Das Digitale Worterbuch der deutschen Sprache DWDS auch Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart ist ein Projekt der Berlin Brandenburgischen Akademie der Wissenschaften dessen Ziel die Erstellung eines digitalen Worterbuchsystems auf der Basis sehr grosser elektronischer Textkorpora ist LogoDabei baut es auf dem sechsbandigen Worterbuch der deutschen Gegenwartssprache WDG auf und verknupft dieses mit eigenen Text und Worterbuchressourcen Es stellt dem Nutzer die Rechtschreibung nach neuestem Stand die Aussprache in Form von Audiodateien und vielfaltige Angaben zur Form Verwendung und Bedeutung seiner Stichworter zur Verfugung Inhaltsverzeichnis 1 Komponenten 1 1 Worterbucher 1 2 Textkorpora 1 3 Paradigmatische Relationen 1 4 Kollokationen 2 Offentlich recherchierbare Korpora 3 Uberarbeitung zeittypischer Artikel 4 Weblinks 5 EinzelnachweiseKomponenten BearbeitenIn der derzeitigen Fassung des DWDS dem Wortinformationssystem werden vier lexikalische Informationstypen verknupft die Worterbuchartikel des WDG automatisch generierte Informationen zu Synonymen Hyponymen Hyperonymen aus dem WDG Textbeispiele aus dem DWDS Kernkorpus sowie statistische Kookkurrenz Informationen aus dem Kernkorpus die so genannten Kollokationen die die Haufigkeiten des Vorkommens benachbarter Worter angeben Worterbucher Bearbeiten DWDS Worterbuch aufbauend auf dem Worterbuch der deutschen Gegenwartssprache Dieses Worterbuch wird laufend uberarbeitet Etymologisches Worterbuch des Deutschen von Wolfgang Pfeifer OpenThesaurus Das Worterbuch der deutschen Gegenwartssprache WDG wurde in Ost Berlin an der Deutschen Akademie der Wissenschaften vom 7 Oktober 1972 an Akademie der Wissenschaften der DDR zwischen 1952 und 1977 unter der Leitung von Ruth Klappenbach erarbeitet Das WDG umfasst uber 4 500 Seiten und enthalt 60 000 bzw unter Hinzunahme der Komposita 121 000 Stichworter Von Februar 2002 bis Marz 2004 wurde das WDG unter Fuhrung der Berlin Brandenburgischen Akademie der Wissenschaften digital erfasst strukturiert und fur die Recherche aufbereitet Das Textkorpus wurde mit Unterstutzung der Deutschen Forschungsgemeinschaft DFG in den Jahren 2000 bis 2003 zusammengestellt sowie ausgebaut und steht seit Marz 2003 als Nachschlagewerk auf einer Website zur Verfugung Deutsches Worterbuch von Jacob Grimm und Wilhelm Grimm Deutsches Worterbuch von Jacob Grimm und Wilhelm Grimm Neubearbeitung Wortgeschichte digital WGd WGd ist ein Teilprojekt des Zentrums fur digitale Lexikographie ZDL an der Niedersachsischen Akademie der Wissenschaften zu Gottingen 1 Textkorpora Bearbeiten Die Textkorpora zum DWDS werden kontinuierlich ausgebaut Mit Stand vom Mai 2018 umfassen sie 13 Milliarden laufende Textworter und bestehen aus zwei grossen Teilkorpora dem Kernkorpus und dem Erganzungskorpus Das DWDS Kernkorpus umfasst etwa 100 Millionen Textworter es ist zeitlich gleichmassig uber das gesamte 20 Jahrhundert gestreut und nach Textsorten ausgewogen Vier Textsorten liegen dem Korpus zugrunde Belletristik 28 42 Zeitung 27 36 wissenschaftliche Fachtexte 23 15 und Gebrauchstexte 21 05 Da fur die transkribierten Texte gesprochener Sprache keine vollstandige zeitliche Ausgewogenheit erreicht werden konnte steht diese als eigenstandiges Korpus unter Spezialkorpora zur Verfugung Das DWDS Kernkorpus ist das erste Referenzkorpus der deutschen Sprache des 20 Jahrhunderts und dem bislang als Standard geltenden British National Corpus BNC in seiner Qualitat zumindest ebenburtig Das DWDS hat mit uber 20 Verlagen und zahlreichen offentlichen und privaten Textgebern Nutzungsvereinbarungen uber rechtebehaftete Texte abgeschlossen und kann z B Werke von Thomas und Heinrich Mann Martin Walser Heinrich Boll Jurgen Habermas oder Victor Klemperer fur die Internetrecherchen zur Verfugung stellen 2 Das Erganzungskorpus umfasst uber 1 5 Milliarden Textworter in etwa 3 5 Millionen Dokumenten Es ist weniger auf Ausgewogenheit als auf Umfang und Aktualitat hin ausgelegt und besteht im Wesentlichen aus Zeitungsquellen der Jahre 1980 2006 Alle Quellen sind bibliographisch referenzierbar und bei der Aufbereitung wurde auf inhaltliche und qualitative Streuung geachtet Paradigmatische Relationen Bearbeiten Uber 65 000 Synonyme Ober und Unterbegriffe wurden mit Hilfe automatischer Analyseprogramme aus den Definitionen des WDG extrahiert Neben dem Nutzen als Synonymworterbuch und Thesaurus kann man uber diesen Informationstyp im WDG nicht mehr nur elektronisch blattern sondern auch semantisch navigieren Beispielsweise kann man vom Stichwort Insekt direkt zu dessen Synonym Kerbtier springen aber genauso zu allen untergeordneten Begriffen wie Ameise Floh Johanniskafer oder Wasserlaufer Kollokationen Bearbeiten Die im Kernkorpus ermittelten statistischen Kollokationen werden grafisch dargestellt Die Kollokationen basieren auf statistischen Assoziationsmassen Mutual Information und t score nbsp Kollokationsgraph fur Ziel Offentlich recherchierbare Korpora BearbeitenIn den Korpora des DWDS kann kostenlos recherchiert werden Aufgrund der Nutzungsvereinbarungen mit den Rechtegebern ist fur eine Vielzahl von Texten jedoch eine vorherige Registrierung notwendig Mehr als 10 000 Benutzer sind im DWDS Wortinformationssystem registriert DWDS Kernkorpus Korpus Der Tagesspiegel 1996 2005 Korpus Berliner Zeitung 1946 1993 erstellt im Rahmen des Projekts DDR Presseportal Korpus Berliner Zeitung 1994 2005 Korpus judischer Periodika des 19 und 20 Jahrhunderts Kooperation mit dem DFG geforderten Projekt Compact Memory mit einem Gesamtumfang von 25 Millionen Textwortern DDR Korpus 9 Millionen Textworter Das DDR Korpus umfasst Texte aus der Zeit von 1949 bis 1990 die in der DDR erschienen sind bzw von DDR Schriftstellern geschrieben und in der Bundesrepublik veroffentlicht wurden Das DDR Korpus wird in Zusammenarbeit mit der Humboldt Universitat zu Berlin weiter ausgebaut Korpus neues deutschland 1946 1990 Korpus Die ZEIT 1946 2016 beschrankt auf digital und online zur Verfugung stehende Texte Korpus Gesprochene Sprache Dieses umfasst Transkripte aus dem gesamten 20 Jahrhundert im Umfang von ca 2 5 Millionen Textwortern Darunter befinden sich Redensammlungen u a von Kaiser Wilhelm II Hitler Ulbricht und Honecker Rundfunkansprachen von 1929 bis 1944 in Kooperation mit dem Deutschen Rundfunkarchiv wurden etwa 80 Stunden Tonmaterial transkribiert ferner Auszuge aus osterreichischen Parlamentsprotokollen und Bundestagsprotokollen sowie Auszuge aus dem Literarischen Quartett Uberarbeitung zeittypischer Artikel BearbeitenDas DWDS Worterbuch basiert in seiner Substanz auf dem Worterbuch der deutschen Gegenwartssprache Ca 2600 der 90 000 Eintrage des WDG die DDR typische Inhalte oder Formulierungen aufwiesen wurden von der DWDS Projektgruppe einer Uberarbeitung unterzogen Durch eine Gruppe von Lexikografen wurden die Bedeutungsparaphrasen und Kompetenzbeispiele in neutralerer Ausdrucksweise formuliert oder wenn sie eine tatsachlich DDR spezifische Verwendung illustrieren entsprechend gekennzeichnet Diese Uberarbeitung betraf weitere ca 2500 Eintrage bzw Lesarten 3 Weblinks BearbeitenDWDS Digitales Worterbuch der deutschen Sprache Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart Berlin Brandenburgische Akademie der Wissenschaften abgerufen am 9 Juli 2023 Offizielle Homepage DWDS Themenglossar zur COVID 19 PandemieEinzelnachweise Bearbeiten Worterbucher im DWDS In DWDS Digitales Worterbuch der deutschen Sprache Berlin Brandenburgische Akademie der Wissenschaften abgerufen am 9 Juli 2023 Website der Berlin Brandenburgischen Akademie der Wissenschaften abgerufen 19 August 2015 DWDS Worterbuch Abgerufen am 4 Juli 2017 Abgerufen von https de wikipedia org w index php title Digitales Worterbuch der deutschen Sprache amp oldid 235322917