www.wikidata.de-de.nina.az
Das Gesetz der Verteilung von Wortlangen bedeutet dass Worter unterschiedlicher Lange in Texten und oder in Worterbuchern nicht chaotisch sondern gesetzmassig verteilt sind Die Wortlange kann man verschieden definieren am gelaufigsten wird sie durch die Zahl der Buchstaben Laute Morphe oder der Silben je Wort angegeben Gleich welche Wahl man trifft ist zu erwarten dass die Haufigkeiten mit denen die nach Lange geordneten Worter in einem Text oder im Lexikon vertreten sind gesetzmassig verteilt sind Das Gesetz der Verteilung von Wortlangen ist einer von vielen Gesetzesvorschlagen der Quantitativen Linguistik Das entsprechende Gesetz haben zuletzt Altmann Wimmer u a 1 abgeleitet die Vorschlage zu diesem Gesetz die seit den 1940er Jahren 2 zuerst von Sergei Tschebanow 1947 William Palin Elderton 1949 3 und Wilhelm Fucks 1955 gemacht wurden sind in dieser neuen Theorie als Spezialfalle enthalten Eine Fulle von Uberprufungen an deutschen und uber 50 weiteren Sprachen uber 4000 Texte und einige Worterbucher bestatigen die Theorie Best 1997 2001 2003 Schmidt 1997 Wortlangen sind damit die bei weitem am besten erforschte Sprachgrosse Zur Geschichte des Gesetzes von den 1940er Jahren an und zu seiner Kritik vergleiche Grzybek 2006 Es hat sich gezeigt dass die Hyperpoisson Verteilung ein besonders haufig anwendbares Modell ist Je nach Sprache Autor Zeit Textsorte mussen aber oft auch andere Modelle eingesetzt werden Das Gesetz gilt analog fur andere Spracheinheiten wie Morphe rhythmische Einheiten Satze und Silben siehe Gesetz der Verteilung von Morphlangen Gesetz der Verteilung rhythmischer Einheiten verschiedener Lange Gesetz der Verteilung von Satzlangen Gesetz der Verteilung von Silbenlangen Inhaltsverzeichnis 1 Untersuchungen zu Wortlangenverteilungen im Deutschen 2 Sonderfall Lange von Komposita 3 Befunde in anderen Sprachen 4 Wortlangen bestimmt nach der Zahl ihrer Buchstaben oder Phoneme 5 Ergebnis und Perspektive 6 Literatur 7 Bibliographie 8 Siehe auch 9 Weblinks 10 EinzelnachweiseUntersuchungen zu Wortlangenverteilungen im Deutschen BearbeitenDer empirische Befund fur das Deutsche ist dass die einsilbigen Worter immer von althochdeutscher Zeit an bei allen Autoren in allen Textsorten etc am haufigsten sind es folgen als nachsthaufige die zweisilbigen usw Bei knapp 2000 Texten gab es immer dasselbe Ergebnis Alle Texte bis auf 5 entsprechen der Hyperpoisson Verteilung Ein Beispiel fur eine Wortlangenverteilung gemessen als Zahl der Silben pro Wort in einem Brief von Kurt Tucholsky 4 x n x NP x 1 522 521 42 250 247 563 87 92 694 32 28 645 7 7 536 2 2 18 Dabei ist x Zahl der Silben pro Wort n x die in diesem Text beobachtete Zahl der Worter mit x Silben NP x die Zahl der Worter mit x Silben die berechnet wird wenn man die Hyperpoisson Verteilung an die beobachteten Daten anpasst Ergebnis die Hyperpoisson Verteilung ist fur diesen Text ein gutes Modell mit dem Testkriterium P 0 85 wobei P als gut erachtet wird wenn es grosser gleich 0 05 ist Fur ausfuhrlichere Erlauterungen sei auf die angegebene Literatur verwiesen Die Wortlangenverteilung dieses Textes ist fur das Deutsche recht typisch am haufigsten sind die Worter die aus nur einer Silbe bestehen es folgen die zwei dann die dreisilbigen usw Nur bei den seltenen Klassen der langen Worter treten Unregelmassigkeiten auf Solche Unregelmassigkeiten verschwinden wenn man sehr umfangreiche Dateien hat Als Beispiel moge der Hinweis auf Kaedings Haufigkeitsworterbuch dienen das im Artikel Wortlange vorgestellt wird Auch an diese Daten kann man die Hyperpoisson Verteilung mit einem sehr guten Ergebnis anpassen 5 Sonderfall Lange von Komposita BearbeitenAls Sonderfall von Wortlangen kann man die Lange von Komposita betrachten Ihre Lange lasst sich danach bestimmen aus wie vielen Lexemen sie zusammengesetzt sind Am Beispiel von Komposita in einem Korpus von Werbetexten 6 wurde folgendes Ergebnis erzielt 7 x n x NP x 1 192 192 412 63 60 663 10 12 664 1 1 975 1 0 246 1 0 06 Dabei ist x 1 Kompositum bestehend aus 2 Lexemen x 2 Kompositum bestehend aus 3 Lexemen undsoweiter n x ist die in diesem Textkorpus beobachtete Zahl der Komposita mit x Lexemen NP x ist die Zahl der Komposita mit x Lexemen die berechnet wird wenn man die Hyperpoisson Verteilung an die beobachteten Daten anpasst Ergebnis die Hyperpoisson Verteilung ist fur dieses Textkorpus ein gutes Modell mit dem Testkriterium P 0 34 wobei P als gut erachtet wird wenn es grosser gleich 0 05 ist Eine Untersuchung zur Lange von Komposita in Pressetexten aus GeoEpoche und FAZ 8 zeigte dass der Unterschied zwischen den Komposita die aus 2 Lexemen bestehen und den dreigliedrigen Komposita wesentlich starker war als bei den Werbetexten Auch hier liess sich eine Verteilung mit Erfolg anpassen Das Ergebnis konnte durch weitere Untersuchungen an deutschen Pressetexten bestatigt werden 9 Fur ausfuhrlichere Erlauterungen sei auf die angegebene Literatur verwiesen Befunde in anderen Sprachen BearbeitenIn anderen Sprachen sind oft nicht die einsilbigen Worter die haufigsten sondern die zwei oder gar erst die dreisilbigen Dies ist abhangig von der Morphologie der Sprachen Zu den Sprachen bei denen nicht die einsilbigen Worter am haufigsten in Texten vorkommen gehoren unter anderen Finnisch und Latein Ein weiteres Beispiel dafur ist das Japanische Sanada 10 untersuchte einen Ausschnitt des Worterbuchs des Japanischen indem sie die Wortlangen gemass der Zahl der Moren pro Wort bestimmte und feststellte dass die 1 verschobene Binomialverteilung ein gutes Modell fur dieses Phanomen abgibt x n x NP x 1 6 9 062 109 129 363 661 615 474 954 976 10 Dabei ist x Zahl der Moren pro Wort n x die in diesem Text beobachtete Zahl der Worter mit x Moren NP x die Zahl der Worter mit x Moren die berechnet wird wenn man die 1 verschobene Binomialverteilung an die beobachteten Daten anpasst Ergebnis Die Binomialverteilung ist fur diesen Text ein gutes Modell mit dem Testkriterium C 0 0047 wobei C als gut erachtet wird wenn es kleiner gleich 0 01 ist Das Testkriterium C wird hier bevorzugt da die Gesamtzahl der Worter n x recht hoch ist P eignet sich eher bei einer deutlich geringeren Gesamtzahl Ergebnisse zu 13 indischen Sprachen fur die jeweils 2 Texte mit der Zipf Alekseev Funktion untersucht wurden prasentieren Mohanty amp Popescu 11 Wortlangen in 28 Sprachen stellen Popescu u a 2013 vor wobei verschiedene Modelle genutzt wurden 12 Bedeutsam ist auch im gleichen Band die Untersuchung von Lu Wang zu Wortlangen im Chinesischen getrennt nach Token und Types wobei unterschiedliche Verteilungen erfolgreich getestet wurden Zusatzlich gelang auch der Nachweis dass Polysemie und Wortlange zusammenhangen Je langer ein Wort desto geringer die Polysemie 13 Damit bestatigt Lu Wang fur das Chinesische einen Zusammenhang der von Altmann Beothy und Best 1982 14 sowie Rothe 1983 15 fur Deutsch Franzosisch Portugiesisch Slowakisch Spanisch und Ungarisch nachgewiesen wurde Wortlangen bestimmt nach der Zahl ihrer Buchstaben oder Phoneme BearbeitenBisher waren Wortlangen durch die Zahl ihrer Silben bestimmt Silben konnen neben Morphen als direkte Konstituenten der Worter betrachtet werden Nimmt man aber Buchstaben oder Phoneme als Kriterium der Wortlangen also ihre indirekten Konstituenten so erhalt man deutlich langere Tabellen da Worter durchaus mit knapp 70 Buchstaben vorkommen 16 wenn auch nicht gerade sehr haufig In einer Untersuchung zu etlichen Sprachen wurde festgestellt dass auch in diesen Fallen ein mathematisches Modell und zwar die Good Verteilung erfolgreich angewendet werden kann 17 Ergebnis und Perspektive BearbeitenDie sehr umfangreichen Befunde zu den Wortlangenverteilungen in vielen verschiedenen Sprachen und Sprachstadien unterstutzen in besonderem Masse die allgemeine Hypothese der Quantitativen Linguistik dass in Sprachsystem und verwendung ebenso wie im Sprachwandel theoretisch begrundbare Gesetze gelten Es ist inzwischen durch etliche Untersuchungen gesichert dass es zwischen der Wortlange und anderen Spracheigenschaften innerhalb einzelner Sprachen eine ganze Reihe von gesetzmassigen Abhangigkeiten gibt vergleiche dazu vor allem den Artikel Linguistische Synergetik Speziell zur Abhangigkeit der Wortlange von der Worthaufigkeit siehe 18 Literatur BearbeitenKarl Heinz Best Hrsg Glottometrika 16 The Distribution of Word and Sentence Length Wissenschaftlicher Verlag Trier Trier 1997 ISBN 3 88476 276 1 Karl Heinz Best Wortlange In Reinhard Kohler Gabriel Altmann amp Rajmund G Piotrowski Hrsg Quantitative Linguistik Quantitative Linguistics Ein internationales Handbuch de Gruyter Berlin New York 2005 ISBN 3 11 015578 8 S 260 273 Karl Heinz Best Quantitative Linguistik Eine Annaherung 3 stark uberarbeitete und erganzte Auflage Peust amp Gutschmidt Gottingen 2006 ISBN 3 933043 17 4 Karl Heinz Best Wortlangen im Deutschen In Gottinger Beitrage zur Sprachwissenschaft 13 2006 23 49 Karl Heinz Best Otto Rottmann Quantitative Linguistics an Invitation RAM Verlag Ludenscheid 2017 ISBN 978 3 942303 51 4 Peter Grzybek History and Methodology of Word Length Studies The State of the Art In Peter Grzybek Hrsg Contributions to the Theory of Text and Language Word Length Studies and Related Issues Springer Dordrecht NL 2006 S 15 90 ISBN 1 4020 4067 9 HB Thomas Jahn Annika Uckel Verteilung der Wortlangen in englischen Spam E Mails In Glottometrics 17 2008 Seite 1 7 PDF Volltext Ioan Iovitz Popescu et alii Word length aspects and languages In Reinhard Kohler Gabriel Altmann eds Issues in Quantitative Linguistics 3 Dedicated to Karl Heinz Best on the occasion of his 70th birthday Ludenscheid RAM Verlag 2013 ISBN 978 3 942303 12 5 S 224 281 Ioan Iovitz Popescu Karl Heinz Best Gabriel Altmann Unified Modeling of Length in Language RAM Verlag Ludenscheid 2014 ISBN 978 3 942303 26 2 Kapitel Word length Seite 14 86 Length of compounds Seite 87 88 Otto Rottmann On Word Lenth in German and Polish In Glottometrics 42 2018 Seite 13 20 PDF Volltext Peter Schmidt Hrsg Glottometrika 15 Issues in General Linguistic Theory and the Theory of Word Length Wissenschaftlicher Verlag Trier Trier 1996 ISBN 3 88476 228 1 S 102 111 Gejza Wimmer Gabriel Altmann Thesaurus of univariate discrete probability distributions Stamm Essen 1999 ISBN 3 87773 025 6 Gejza Wimmer Gabriel Altmann Towards a Unified Derivation of Some Linguistic Laws In Peter Grzybek ed Contributions to the Science of Text and Language Word length studies and related issues Springer Dordrecht 2006 S 329 337 ISBN 1 4020 4067 9 HB Gejza Wimmer Viktor Witkovsky Gabriel Altmann Modification of Probability Distributions Applied to Word Length Research In Journal of Quantitative Linguistics 6 1999 257 268 Bibliographie BearbeitenBibliography of Word Length In Glottometrics 34 2016 Seite 84 89 PDF Volltext Bibliographie zum Gesetz der Verteilung von Wortlangen Siehe auch BearbeitenEinsilbler Gesetz der Verteilung von Morphlangen Gesetz der Verteilung rhythmischer Einheiten verschiedener Lange Gesetz der Verteilung von Satzlangen Gesetz der Verteilung von Schriftzeichen verschiedener Komplexitat Gesetz der Verteilung von SilbenlangenWeblinks Bearbeiten nbsp Wiktionary Wortlange Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen nbsp Wiktionary Wortlangenverteilung Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen Bibliographien und weitere Informationen zum Gottinger Projekt Quantitative Linguistik Grazer Projekt zur Quantitativen Textanalyse QuanTA Einzelnachweise Bearbeiten Gejza Wimmer Reinhard Kohler Rudiger Grotjahn amp Gabriel Altmann Towards a Theory of Word Length Distribution In Journal of Quantitative Linguistics 1 1994 98 106 Gejza Wimmer Gabriel Altmann The Theory of Word Length Distribution Some Results and Generalizations In Peter Schmidt Hrsg Glottometrika 15 Wissenschaftlicher Verlag Trier Trier 1996 S 112 133 Karl Heinz Best Sergej Viktorovic Cebanov Biographische Notiz Sergej Grigor evic Cebanov 1897 1966 In Karl Heinz Best Hrsg Haufigkeitsverteilungen in Texten Peust amp Gutschmidt Gottingen 2001 S 281 283 Sergej Viktorovic Cebanov O podcinenii recevych ukladov indoevropejskoj gruppy zakonu Puassona In Doklady Akademii Nauk SSSR Tom 55 2 1947 S 103 106 On conformity of language structures within the Indoeuropean family to Poisson s law William P Elderton A few statistics on the length of English words In Journal of the Royal Statistical Society Series A General Volume CXII Part IV 1949 S 436 445 Wilhelm Fucks Theorie der Wortbildung In Mathematisch Physikalische Semesterberichte Bd 4 1955 S 195 212 Best Karl Heinz 2009 William Palin Elderton 1877 1962 In Glottometrics 19 p 99 101 PDF Volltext Stefan Ammermann Zur Wortlangenverteilung in deutschen Briefen uber einen Zeitraum von 500 Jahren In Karl Heinz Best Hrsg Haufigkeitsverteilungen in Texten Peust amp Gutschmidt Gottingen 2001 S 59 91 S 81 Siehe Best 2006 Seite 41 Bernhard Sowinski Werbeanzeigen und Werbesendungen Oldenbourg Munchen 1979 Seite 110 ISBN 3 486 03931 8 Bernhard Sowinski Werbung Niemeyer Tubingen 1998 Seite 67 ISBN 3 484 37104 8 Best 2006 Seite 47 Stefanie Poppe Die Verteilung von Kompositalangen in deutschen journalistischen Texten In Gottinger Beitrage zur Sprachwissenschaft 15 2007 Seite 79 85 Popescu Best Altmann 2014 Seite 87 88 Karl Heinz Best Langen von Komposita im Deutschen in Glottometrics 23 2012 S 1 6 PDF Volltext Haruko Sanada Investigations in Japanese Historical Lexicology Revised Edition Peust amp Gutschmidt Gottingen 2008 S 96f ISBN 978 3 933043 12 2 Panchanan Mohanty Ioan Iovitz Popescu Word length in Indian languages 1 in Glottometrics 29 2014 S 95 109 PDF Volltext Ioan Iovitz Popescu et alii Word length aspects and languages In Reinhard Kohler Gabriel Altmann eds Issues in Quantitative Linguistics 3 Dedicated to Karl Heinz Best on the occasion of his 70th birthday Ludenscheid RAM Verlag 2013 S 224 281 ISBN 978 3 942303 12 5 Lu Wang Word length in Chinese In Reinhard Kohler Gabriel Altmann eds Issues in Quantitative Linguistics 3 Dedicated to Karl Heinz Best on the occasion of his 70th birthday Ludenscheid RAM Verlag 2013 S 39 53 ISBN 978 3 942303 12 5 G Altmann E Beothy und K H Best Die Bedeutungsmenge und das Menzerathsche Gesetz In Zeitschrift fur Phonetik Sprachwissenschaft und Kommunikationsforschung 35 S 537 543 U Rothe Wortlange und Bedeutungsmenge Eine Untersuchung zum Menzerathschen Gesetz an drei romanischen Sprachen In R Kohler J Boy eds Glottometrika 5 Brockmeyer Bochum 1983 S 101 112 ISBN 3 88339 307 X Siehe Artikel Wortlange Kurzeste Worter langste Worter Mats Eeg Olofsson A word length regularity and its genesis in Glottometrics 19 2009 S 49 69 PDF Volltext U Strauss G Altmann Word length and frequency 14 Juli 2006 abgerufen am 3 Oktober 2022 Abgerufen von https de wikipedia org w index php title Gesetz der Verteilung von Wortlangen amp oldid 231490985