www.wikidata.de-de.nina.az
Das Deutsche Textarchiv DTA ist ein seit Juli 2007 an der Berlin Brandenburgischen Akademie der Wissenschaften beheimatetes und von der Deutschen Forschungsgemeinschaft gefordertes wissenschaftliches digitales Textarchiv Das Deutsche Textarchiv hat es sich zur Aufgabe gemacht eine disziplinubergreifende Auswahl deutschsprachiger Texte aus der Zeit um 1600 bis 1900 auf Grundlage von Erstausgaben zu digitalisieren und als linguistisch annotiertes Volltextkorpus im Internet bereitzustellen Inhaltsverzeichnis 1 Struktur und Aufbau 2 Technische Realisierung 3 Perspektiven 4 Einzelnachweise 5 WeblinksStruktur und Aufbau BearbeitenErklartes Ziel des Deutschen Textarchives ist es dem Nutzer eine reprasentative und disziplinubergreifende Auswahl digitalisierter deutschsprachiger Texte zur Verfugung zu stellen Neben kanonbildenden literarischen Werken legt die Konzeption des Deutschen Textarchives einen Schwerpunkt auf weniger bekannte und insbesondere auch nicht literarische Texte Um eine reprasentative Auswahl der Werke zu gewahrleisten greift das Deutsche Textarchiv auf eine auf der Grundlage von Bibliographien erstellte eigene Auswahlliste zuruck Das Archiv wird zudem einen grossen Teil des Textkorpus des ebenfalls an der Akademie beheimateten Deutschen Worterbuchs Grimmsches Worterbuch enthalten In einem letzten Schritt bat man die interdisziplinaren Mitglieder der Berlin Brandenburgischen Akademie der Wissenschaften die nun erstellte Liste zu bewerten und aus ihrer fachlichen Perspektive fehlende Werke vorzuschlagen Unter der Leitung des Germanisten und Psycholinguisten Wolfgang Klein arbeitet im Deutschen Textarchiv an Aufbau und Pflege des Bestandes ein interdisziplinares Team aus Buch und Informationswissenschaftlern Germanisten Computerlinguisten und Informatikern sowie eine Reihe von studentischen Hilfskraften Technische Realisierung BearbeitenBei der Digitalisierung des Bestandes arbeitet das DTA mit zahlreichen wissenschaftlichen Institutionen und Bibliotheken zusammen die entsprechende Exemplare aus ihren Bestanden zur Digitalisierung zur Verfugung stellen Seit dem Beginn des Bestandsaufbaus wurden circa 600 000 Bilddigitalisate mit einem Datenvolumen von insgesamt knapp zehn Terabyte angefertigt Diese Digitalisate bilden die Basis fur die Erstellung der Volltexte Je nach Qualitat und Komplexitat der Vorlagen werden die Texte entweder durch eine selbst entwickelte Texterkennungssoftware OCR erfasst und nachkorrigiert oder durch einen externen Partner im Double Keying Verfahren erfasst In einem letzten Schritt werden die Texte sprachwissenschaftlich mit computerlinguistischen Hilfsmitteln indiziert Die Texte stehen sowohl im HTML Format als auch in einem TEI P5 Format zum Download zur Verfugung Ab Juli 2020 gilt fur das DTA Kernkorpus und weitere Texte aus den DTA Erweiterungen DTAE die freie Creative Commons Lizenz CC BY SA 4 0 1 Perspektiven BearbeitenFur eine spatere Projektphase hat sich das Deutsche Textarchiv vorgenommen den Bestand zu einem aktiven Archiv zu entwickeln So sollen eine private Textauswahl das Setzen persistenter Lesezeichen auf Textpassagen und das Hinzufugen von Annotationen fur den Benutzer moglich sein Sollten die personellen und technischen Voraussetzungen in der Zukunft vorhanden sein hat man sich das Ziel gesetzt registrierten Nutzern die Berechtigung einzuraumen auf der Grundlage der Richtlinien des Archivs eigenstandig Texte in das DTA zu integrieren Die Digitalisierung im Deutschen Textarchiv eroffnet neben sprach und literaturwissenschaftlichen Untersuchungsmoglichkeiten auch buch und kommunikationswissenschaftliche Forschungsperspektiven wie beispielsweise Forschungen zur Typographie und Verlagsgeschichte Einzelnachweise Bearbeiten Deutsches Textarchiv Abgerufen am 10 April 2022 Weblinks BearbeitenDeutsches Textarchiv DTA Homepage Deutsches Textarchiv Berlin Brandenburgische Akademie der Wissenschaften Abgerufen von https de wikipedia org w index php title Deutsches Textarchiv amp oldid 235201287