www.wikidata.de-de.nina.az
Eine Haufigkeitsklasse ist in der Linguistik ein statistisches Mass fur die Gebrauchshaufigkeit eines Wortes in einer naturlichen Sprache oder in einem Sprachausschnitt Zur Berechnung der Haufigkeitsklasse wird das Zipfsche Gesetz verwendet das als Sprachgesetz eine besondere Bedeutung in der Quantitativen Linguistik hat Auch in der Korpuslinguistik haben sich Haufigkeitsklassen als empirisches Haufigkeitsmass etabliert Vorkommenshaufigkeit von Personalpronomina in einem Korpus der serbokroatischen Sprache Inhaltsverzeichnis 1 Berechnung 2 Wortformen und Lexeme 3 Siehe auch 4 Literatur 5 Weblinks 6 EinzelnachweiseBerechnung BearbeitenAls Grundlage fur die Berechnung wird eine reprasentative und hinreichend grosse Menge an verfugbaren schriftlichen Quellen aus einer Sprache verwendet die Korpus genannt wird Das am haufigsten auftretende Wort in diesem Korpus wird als Vergleichsgrundlage verwendet In der deutschen Schriftsprache ist dies das Wort der in der englischen the der die das in der schwedischen och und Das Zipfsche Gesetz dient dabei als Berechnungsgrundlage Der Wert der Haufigkeitsklasse N displaystyle N nbsp berechnet sich dabei mit dem Logarithmus zur Basis 2 des Quotienten aus dem zu untersuchenden Wort und dem am haufigsten auftretenden Wort N 0 5 log 2 Haeufigkeit des untersuchten Wortes Haeufigkeit des haeufigsten Wortes displaystyle N left lfloor 0 5 log 2 left frac text Haeufigkeit des untersuchten Wortes text Haeufigkeit des haeufigsten Wortes right right rfloor nbsp Die Gaussklammer displaystyle lfloor dotso rfloor nbsp rundet das Zwischenergebnis auf eine ganze Zahl ab Zusammen mit dem addierten Wert 0 5 fuhrt die Gaussklammer hier dazu dass der Wert des Logarithmus auf die nachste ganze Zahl auf oder abgerundet wird dabei wird 0 5 aufgerundet zu 1 Die so berechnete Haufigkeitsklasse N displaystyle N nbsp ist eine ganze Zahl die ausdruckt um wie viel Mal haufiger das haufigste Wort als das untersuchte Wort im ausgewerteten Datenbestand auftritt Das am haufigsten vorkommende Wort selbst gehort der Haufigkeitsklasse 0 an und i A ist es der einzige Vertreter dieser Klasse Worter die etwa 1 2 N displaystyle tfrac 1 2 N nbsp Mal so haufig wie dieses auftreten werden in die Haufigkeitsklasse N displaystyle N nbsp eingeordnet Daraus ergibt sich dass ein Wort umso haufiger vorkommt je kleiner seine Haufigkeitsklasse ist Grosse der Haufigkeitsklassen RangNach dem Zipfschen Gesetz erwartet man dass die Klasse N displaystyle N nbsp etwa 2 N displaystyle 2 N nbsp Worter Types enthalt und dass die Summe ihrer Vorkommen Tokens in jeder Klasse ungefahr gleich ist wobei diese Naherung fur die obersten und untersten Klassen am wenigsten genau ist Insbesondere erwartet man nach dem Zipfschen Gesetz fur jedes Korpus dass ungefahr die Halfte aller auftretenden Worter Types jeweils nur einmal vorkommt Aus dem Zipfschen Gesetz ergibt sich als erste Abschatzung dass die Klasse 0 etwa 2 0 displaystyle 2 0 nbsp 1 Wort enthalt die Klasse 1 etwa 2 1 displaystyle 2 1 nbsp 2 Worter die Klasse 9 etwa 2 9 displaystyle 2 9 nbsp 512 Worter usw 1 In allen Klassen bis einschliesslich zur Klasse 9 sind etwa 1000 Worter enthalten Die folgende Haufigkeitsklasse 10 umfasst damit diejenigen etwa 1000 Worter die in der Haufigkeit etwa auf Rang 1000 bis 2000 liegen dies sind allerdings nur recht grobe Anhaltswerte 2 Wortformen und Lexeme BearbeitenHaufigkeitsklassen konnen auf zwei linguistischen Ebenen betrachtet werden Fur eine einzelne Wortform wie oben dargestellt oder fur ein gesamtes Lexem mit seinen verschiedenen Wortformen Das am haufigsten vorkommende Wort dessen Haufigkeit bei der Berechnung der Haufigkeitsklasse als Vergleichsgrosse verwendet wird sollte auf derselben linguistischen Ebene bestimmt sein In der deutschen Schriftsprache ist die haufigste Wortform das Wort der und das haufigste Lexem der bestimmte Artikel mit den flektierten Formen der die das des dem den Siehe auch BearbeitenFrequenzworterbuch Liste der haufigsten Worter der deutschen SpracheLiteratur BearbeitenHelmut Meier Deutsche Sprachstatistik 2 Auflage Olms Hildesheim 1978 ISBN 978 3 487 00735 9 Weblinks Bearbeitenhttps wortschatz uni leipzig de Wortschatzlexikon der Universitat Leipzig auf Basis deutscher Quellen mit Angabe der Haufigkeitsklasse DeReWo Korpusbasierte Grund Wortformenlisten des Instituts fur Deutsche Sprache mit Angabe der Haufigkeitsklasse Online Rechner fur HaufigkeitsklassenEinzelnachweise Bearbeiten Dies stimmt einigermassen mit der Praxis uberein Laut den Untersuchungen der Uni Leipzig ist der Klasse 9 ein log Anzahl der Worter in HKL 9 von etwa 6 5 zugeordnet es durften sich somit etwa 700 Worter in dieser Klasse befinden siehe Grafik Anzahl der Worter in den Haufigkeitsklassen Memento des Originals vom 5 Marz 2016 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot wortschatz uni leipzig de auf FAQ zum Wortschatz Uni Leipzig Memento des Originals vom 12 November 2015 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot wortschatz uni leipzig de Verwendbar z B um die Angaben aus den Haufigkeitsabfragen besser deuten zu konnen Abgerufen von https de wikipedia org w index php title Haufigkeitsklasse amp oldid 219594189