www.wikidata.de-de.nina.az
Das Deutsche Referenzkorpus kurz DeReKo ist ein elektronisches Archiv von deutschsprachigen Textkorpora geschriebener Sprache das seit 1964 existiert und vom Institut fur Deutsche Sprache IDS in Mannheim gepflegt und kontinuierlich ausgebaut wird Mit derzeit uber 53 Milliarden Wortern Stand 8 Marz 2022 ist DeReKo die weltweit grosste Sammlung elektronischer Korpora der deutschen Gegenwartssprache die fur wissenschaftliche Zwecke bestimmt ist 1 2 Uber die kostenfreie Webanwendung COSMAS II ist DeReKo fur angemeldete Benutzer offentlich zuganglich 3 Inhaltsverzeichnis 1 Alternative Bezeichnungen 2 Konzeption und Zusammensetzung 3 Zugang 4 Literatur 5 Weblinks 6 EinzelnachweiseAlternative Bezeichnungen BearbeitenAuf das Deutsche Referenzkorpus wird oft auch unter anderen Bezeichnungen verwiesen u a sind dies die Bezeichnungen Mannheimer Korpora IDS Korpora COSMAS Korpora Archiv der Korpora geschriebener Gegenwartssprache am IDS Die Bezeichnung Deutsches Referenzkorpus DeReKo wurde ursprunglich nur fur einen Teil des heutigen Archivs verwendet der zwischen 1999 und 2002 in einem gleichnamigen Projekt aufgebaut wurde an dem mehrere Institutionen beteiligt waren Seit 2004 ist sie die offizielle Bezeichnung fur das gesamte Korpusarchiv Konzeption und Zusammensetzung BearbeitenDas Deutsche Referenzkorpus enthalt belletristische wissenschaftliche und popularwissenschaftliche Texte eine grosse Zahl von Zeitungstexten sowie diverse weitere Textsorten Die Texte decken den Zeitraum vom 18 Jahrhundert 4 bis in die Gegenwart ab Im Gegensatz zu einigen anderen bekannten Korpora und Korpusarchiven wie etwa das DWDS Kernkorpus oder das British National Corpus ist das Deutsche Referenzkorpus jedoch ausdrucklich nicht als ein ausgewogenes Korpus konzipiert So sind die Texte weder nach bestimmten vorgegebenen Prozentanteilen auf die einzelnen Textsorten verteilt noch gleichmassig uber den abgedeckten Zeitraum verteilt Diese Konzeption folgt der Tatsache dass grundsatzlich nur in Bezug auf einen festen Sprachausschnitt d h eine feste Grundgesamtheit beurteilt werden kann ob ein Korpus eine ausgewogene oder sogar reprasentative Stichprobe darstellt Unterschiedliche sprachwissenschaftliche Fragestellungen konnen sich aber auf sehr unterschiedliche Sprachausschnitte beziehen insofern ist das Deutsche Referenzkorpus als eine Art Ur Stichprobe zum Gebrauch der deutschen Schriftsprache konzipiert aus der je nach Fragestellung und zugehoriger Grundgesamtheit gezielt eine ausgewogene Stichprobe zusammengestellt werden kann Ein solches aus Texten eines bestehenden Korpusarchivs zusammengestelltes Korpus wird auch als ein virtuelles Korpus bezeichnet Zugang BearbeitenWegen urheber und lizenzrechtlicher Bestimmungen darf das DeReKo Archiv nicht kopiert und insbesondere auch nicht zum Download angeboten werden Es ist uber die Schnittstelle COSMAS II recherchierbar und analysierbar wobei sich Nutzer namentlich registrieren und zu einer rein wissenschaftlichen und nicht kommerziellen Nutzung verpflichten mussen COSMAS II bietet Nutzern u a die Moglichkeit aus dem Deutschen Referenzkorpus gezielt ein zu ihrer Fragestellung passendes virtuelles Korpus zusammenzustellen und zu verwenden Derzeit sind weltweit rund 37 000 Nutzer aus 110 Landern fur COSMAS II registriert und konnen in DeReKo wissenschaftliche Recherchen und Analysen durchfuhren 5 Literatur BearbeitenKupietz Marc Belica Cyril Keibel Holger Witt Andreas 2010 The German Reference Corpus DeReKo A primordial sample for linguistic research PDF 727 kB In Calzolari N et al eds Proceedings of the 7th conference on International Language Resources and Evaluation LREC 2010 Valletta Malta European Language Resources Association ELRA S 1848 1854 Kupietz Marc Keibel Holger 2009 The Mannheim German Reference Corpus DeReKo as a basis for empirical linguistic research PDF 488 kB In Working Papers in Corpus based Linguistics and Language Education No 3 Tokyo Tokyo University of Foreign Studies TUFS S 53 59 Weblinks BearbeitenAusbau und Pflege der Korpora geschriebener Gegenwartssprache Das Deutsche Referenzkorpus DeReKo Beschreibung beim Institut fur Deutsche Sprache COSMAS II Recherche und Analysesystem zum Deutschen Referenzkorpus und anderen schriftsprachlichen KorporaEinzelnachweise Bearbeiten Das Deutsche Referenzkorpus DeReKo Ausbau und Pflege der Korpora geschriebener Gegenwartssprache In Digitale Sprachwissenschaft Institut fur Deutsche Sprache Marz 2019 abgerufen am 3 Mai 2019 Ausbau und Pflege der Korpora geschriebener Gegenwartssprache Abruf am 14 April 2023 COSMAS II Anmeldung Institut fur Deutsche Sprache Abruf 16 November 2018 Textorganisation unter COSMAS II Archive Abgerufen am 6 Januar 2022 COSMAS II Ubersicht uber das Portal Institut fur Deutsche Sprache Abruf 16 November 2018 Abgerufen von https de wikipedia org w index php title Deutsches Referenzkorpus amp oldid 232825472