www.wikidata.de-de.nina.az
Eine Baumbank englisch Treebank auch geparstes Korpus ist ein Textkorpus in dem jeder Satz geparst also mit syntaktischer Struktur annotiert wurde Der Begriff Baumbank bezieht sich darauf dass die syntaktische Struktur gewohnlich als eine Baumstruktur reprasentiert wird Beispielbaum fur John loves MaryHybrid constituency dependency tree from the Quranic Arabic Corpus Baumbanken werden oft auf Korpora erstellt die bereits mit Part of speech Tags annotiert wurden Zudem werden Baumbanken manchmal mit semantischer oder anderer linguistischer Information erweitert Baumbanken konnen manuell erstellt werden indem Linguisten jeden Satz mit syntaktischer Struktur annotieren aber auch halbautomatisch so dass ein Parser automatisch syntaktische Struktur zuordnet die dann von einem Linguisten gepruft und wenn notig korrigiert wird In der Praxis ist das komplette Uberprufen und Parsen von naturlichsprachlichen Texten ein arbeitsintensiver Prozess Einige Baumbanken folgen in ihrer syntaktischen Annotation einer bestimmten linguistischen Theorie z B die BulTreeBank mit HPSG aber die meisten sind weniger theoriespezifisch Trotzdem lassen sich im Wesentlichen zwei Gruppen unterscheiden Baumbanken die Phrasenstruktur annotieren z B Penn Treebank oder ICE GB und solche die Abhangigkeitsstruktur annotieren z B Prague Dependency Treebank oder die Quranic Arabic Dependency Treebank Literatur BearbeitenWerner Kallmeyer Gisela Zifonun Hrsg Sprachkorpora Datenmengen und Erkenntnisfortschritt Walter de Gruyter GmbH amp Co KG Berlin 2007 ISBN 978 3 11 019273 5 Weblinks BearbeitenAnnotationsguidelines zur Deutschen Diachronen Baumbank abgerufen am 8 Oktober 2015 Abgerufen von https de wikipedia org w index php title Baumbank Linguistik amp oldid 208486316