www.wikidata.de-de.nina.az
Das British National Corpus BNC ist ein englisches Textkorpus in Form einer 100 Millionen Worter umfassenden Sammlung von geschriebener und gesprochener Sprache Es umfasst eine Vielzahl verschiedener Quellen um einen reprasentativen Querschnitt durch das Britische Englisch des spaten 20 Jahrhunderts fur wissenschaftliche Zwecke zur Verfugung stellen zu konnen Merkmale BearbeitenRund neunzig Prozent des BNC bestehen aus Sprachdaten schriftlicher Sprache etwa Auszugen aus regionalen und uberregionalen Zeitungen Fachzeitschriften Zeitschriften aus vielen unterschiedlichen Interessensgebieten akademischen Buchern Belletristik Romane etc offiziellen und privaten Briefen Aufsatzen aus Schule und Universitat sowie vielen anderen Textsorten Die verbleibenden zehn Prozent sind mundliche Sprachdaten und beinhalten zum Grossteil spontansprachliche Aufzeichnungen aus dem Alltag die von Freiwilligen unterschiedlichen Alters unterschiedlicher Herkunft und unterschiedlicher sozialer Klasse aufgenommen wurden um so ein demographisches Gleichgewicht zu erreichen Die aufgezeichneten Gesprache entstanden in unterschiedlichsten Situationen und reichen von formellen Geschafts und Regierungsversammlungen bis hin zu Radiosendungen und Telefongesprachen Die Arbeit am BNC begann im Jahre 1991 und dauerte bis 1994 Nach der Fertigstellung des Projektes wurden keinen neuen Texte hinzugefugt dennoch aber wurde das Textkorpus vor der Veroffentlichung der zweiten Auflage unter der Bezeichnung BNC World leicht uberarbeitet Zwei Sub Korpora mit Auszugen aus dem BNC wurden veroffentlicht der BNC Sampler eine Sammlung von je einer Million Worter geschriebener und gesprochener Sprache und BNC Baby vier Millionen Worter aus vier unterschiedlichen Textsorten Das BNC hat hinsichtlich der Bestimmungskriterien von Textkorpora vier Haupteigenschaften Es ist einsprachig Das BNC umfasst modernes Britisches Englisch ohne Daten aus anderen Sprachen die auf den Britischen Inseln verwendet werden Dennoch tauchen Worter nichtbritischer Herkunft im BNC auf Es ist synchronisch Das BNC deckt allein das Britische Englisch des spaten 20 Jahrhunderts ab Es ermoglicht keinen Einblick in die historischen Entwicklungen die es hervorgebracht haben und keine historischen Vergleiche Es ist allgemein Das BNC beinhaltet viele verschiedene Stile und Varietaten und beschrankt sich nicht auf ein spezielles thematisches Gebiet Genre oder Register Es beinhaltet Textauszuge Samples Fur die schriftlichen Quellen wurden 45 000 Worter aus unterschiedlichen Teilen eines einzigen Textes des jeweiligen Autors entnommen Kurzere Texte bis zu einem Umfang von 45 000 Wortern sowie Texte von mehreren Autoren wie etwa Magazine und Zeitungsartikel wurden jedoch vollstandig in das BNC aufgenommen Die Aufnahme von Textauszugen ermoglicht eine grossere Bandbreite unterschiedlicher Textsorten innerhalb der 100 Millionen Grenze zu reprasentieren und vermeidet somit eine Uberreprasentation idiosynkratischer Texte Siehe auch BearbeitenMunich UCL Morphology CorpusWeblinks BearbeitenHomepage des British National Corpus englisch phrasesinenglish org ein Server zur Darstellung von Konkordanzen n Grams etc auf der Basis des BNC Abgerufen von https de wikipedia org w index php title British National Corpus amp oldid 208718480