www.wikidata.de-de.nina.az
Dieser Artikel befasst sich mit dem Echten Zipfschen Gesetz Fur das sogenannte Falsche siehe Falsches zipfsches Gesetz Das Zipfsche Gesetz nach George Kingsley Zipf der dieses Gesetz in den 1930er Jahren aufstellte ist ein Modell mit dessen Hilfe man bei bestimmten Grossen die in eine Rangfolge gebracht werden deren Wert aus ihrem Rang abschatzen kann Haufige Verwendung findet das Gesetz in der Sprachwissenschaft Linguistik speziell in der Korpuslinguistik und Quantitativen Linguistik wo es zum Beispiel versucht die Haufigkeit von Wortern in einem Text zur Rangfolge in Beziehung zu setzen Das Zipfsche Gesetz markierte den Beginn dieses Ansatzes der Quantitativen Linguistik Ihm liegt ein Potenzgesetz zugrunde das von der Pareto Verteilung bzw Zipf Verteilung mathematisch beschrieben wird Inhaltsverzeichnis 1 Einfache Zipfverteilung 2 Wahrscheinlichkeitsverteilung 3 Beispiele 4 Siehe auch 5 Literatur 6 Weblinks 7 EinzelnachweiseEinfache Zipfverteilung BearbeitenDie vereinfachte Aussage des Zipfschen Gesetzes lautet Wenn die Elemente einer Menge beispielsweise die Worter eines Textes nach ihrer Haufigkeit geordnet werden ist die Wahrscheinlichkeit p p ihres Auftretens umgekehrt proportional zum Platz n n auf der Haufigkeitsliste hier kurz Rang genannt p n 1 n p n sim tfrac 1 n Der Normierungsfaktor bei N N Elementen ist durch die harmonische Reihe H N n 1 N 1 n ln N 0 577 ln 1 78 N H N sum n 1 N frac 1 n approx ln N 0 577 approx ln 1 78 cdot N gegeben und lasst sich nur fur endliche Mengen angeben Damit folgt p n 1 H N 1 n 1 n ln 1 78 N displaystyle p n frac 1 H N cdot frac 1 n approx frac 1 n cdot ln 1 78 cdot N Wahrscheinlichkeitsverteilung BearbeitenDas Zipfsche Gesetz hat seinen Ursprung in der Linguistik Es besagt dass bestimmte Worter viel haufiger auftreten als andere und die Verteilung einer Hyperbel 1 n tfrac 1 n ahnelt Beispielsweise treten bei den meisten Sprachen Worter umso seltener auf je langer sie sind Der Ordnungsparameter Rang n lasst sich als kumulative Grosse beschreiben Der Rang n n ist gleichbedeutend mit der Anzahl aller Elemente die genauso gross oder grosser sind als n n Fur Rang 1 gibt es genau ein Element namlich das grosste Fur Rang 2 sind es zwei namlich das erste und das zweite Element fur 3 drei usw Zipf nimmt einen einfachen reziproken Zusammenhang zum Rang an y Rang Rang a y text Rang sim text Rang a In der ursprunglichen Form ist das Zipfsche Gesetz frei von Parametern es ist a 1 a 1 Die Zipfsche Verteilung entspricht der Pareto Verteilung unter Vertauschung von Ordinate und Abszisse y x x a Zipf x y y 1 a Pareto y x sim x a text Zipf Leftrightarrow x y sim y frac 1 a text Pareto Beide sind kumulative Verteilungsfunktionen die einem Potenzgesetz gehorchen Der Exponent e e der Verteilungsdichtefunktion lautet entsprechend e 1 1 a e 1 frac 1 a und fur den einfachen Fall a 1 a 1 e 2 e 2 Beispiele Bearbeiten Zipf Verteilung der Worthaufigkeiten auf Basis von Effi Briest Zipf Buchstabenhaufigkeit eines deutschen TextesDie Verteilung der Worthaufigkeiten in einem Text linke Grafik entspricht in etwa qualitativ einer einfachen Zipfschen Verteilung Das Zipfsche Gesetz gibt den Exponenten a a der kumulativen Verteilungsfunktion vor a 1 a 1 Der Fitwert fur die Worthaufigkeiten betragt jedoch a 0 83 displaystyle a 0 83 gleichbedeutend mit dem Exponenten a pareto 1 20 displaystyle a text pareto 1 20 einer Paretoverteilung und dem Exponenten e e einer Potenz Verteilungsdichtefunktion von e 2 20 displaystyle e 2 20 Auch die Verteilung der Buchstabenhaufigkeiten ahnelt einer Zipfschen Verteilung Eine Statistik basierend auf 20 30 Buchstaben ist aber nicht ausreichend um den Verlauf mit einer Potenzfunktion anzupassen Zipf Verteilung und Messung der Grossenverteilung von StadtenEin weiteres Beispiel aus dem Artikel Pareto Verteilung behandelt die Grossenverteilung von Stadten Auch hier kann man bei einzelnen Landern z B Deutschland einen Zusammenhang sehen der einem Potenzgesetz zu gehorchen scheint allerdings mit auffallenden Abweichungen Die Grafik rechts stellt die Zipf Naherung den Messwerten gegenuber Der lineare Verlauf in der doppeltlogarithmischen Verteilung stutzt die Annahme eines Potenzgesetzes Anders als die Vermutung von Zipf hat der Exponent nicht den Wert 1 sondern den Wert 0 77 entsprechend einem Exponenten einer Potenzdichteverteilung von e 2 3 displaystyle e 2 3 Diese Theorie nach der sich die Einwohnerzahlen und Grossen unabhangig voneinander entwickelnden Stadten dennoch einem ubergeordneten Gesetz folgend entwickeln findet auch bei der Ermittlung zu erwartender Ortsgrossen Anwendung 1 Die Bedeutung der Zipf Verteilung liegt in der schnellen qualitativen Beschreibung von Verteilungen aus den unterschiedlichsten Bereichen wahrend die Pareto Verteilung den Exponenten der Verteilung verfeinert Beispielsweise ist die Datenbasis fur einen Fit bei der Angabe der Einwohnerzahl von nur sieben Stadten zu klein Das Zipfsche Gesetz liefert eine Naherung Rang n Stadt Einwohner 1 Rang p n p n Menschen Abweichung in 1 Berlin 3522896 1 0 39 3531136 31 0 232 Hamburg 1626220 0 5 0 19 1765568 15 8 573 Munchen 1206683 0 33 0 13 1177045 44 2 464 Koln 946280 0 25 0 1 882784 08 6 715 Frankfurt 635150 0 2 0 08 706227 26 11 196 Dortmund 624445 0 17 0 06 588522 72 0 937 Essen 594058 0 14 0 06 504448 04 19 22Unter den Schlagworten Potenzgesetz Skalengesetz oder Selbstorganisation wird uber Grunde fur das Auftreten von Potenzverteilungen diskutiert Siehe auch BearbeitenBradfords Gesetz George Udny Yule Yule Verteilung Literatur BearbeitenHelmut Birkhan Das Zipfsche Gesetz das schwache Prateritum und die germanische Lautverschiebung Osterreichische Akademie der Wissenschaften Philosophisch Historische Klasse Sitzungsberichte Band 348 Verlag der Osterreichischen Akademie der Wissenschaften Wien 1979 ISBN 3 7001 0285 2 David Crystal Die Cambridge Enzyklopadie der Sprache Campus Verlag Frankfurt am Main u a 1993 ISBN 3 593 34824 1 Xavier Gabaix Zipf s law for cities An explanation In The Quarterly Journal of Economics Band 114 Nr 3 1999 S 739 767 doi 10 1162 003355399556133 Henri Guiter Michail V Arapov Hrsg Studies on Zipf s Law Quantitative Linguistics Band 16 Studienverlag Brockmeyer Bochum 1982 ISBN 3 88339 244 8 Matteo Marsili Yi Cheng Zhang Interacting Individuals Leading to Zipf s Law In Physical Review Letters Band 80 Nr 12 1998 S 2741 2744 doi 10 1103 PhysRevLett 80 2741 George Kingsley Zipf The Psycho Biology of Language An Introduction to Dynamic Philology Mifflin Boston MA 1935 The M I T Press Cambridge MA 1968 George Kingsley Zipf Human Behavior and the Principle of Least Effort An Introduction to Human Ecology Addison Wesley Cambridge MA 1949 Weblinks Bearbeiten Wiktionary Zipfsches Gesetz Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen Umfangreiche Bibliografie Memento vom 1 November 2012 im Internet Archive Zipf s law and the creation of musical context Zipfsches Gesetz am Beispiel Deutscher Wortschatz Zipf Power laws and Pareto Use of Hermetic Word Frequency Counter to Illustrate Zipf s Law B McCOWAN et al The appropriate use of Zipf s law in animal communication studies ANIMAL BEHAVIOUR 2005 69 F1 F7 PDF 167 kB Das Zipfsche Gesetz in den Primfaktoren der Fibonacci Zahlen Das Zipfsche Gesetz in der logistischen Gleichung Tobias Just und Patrick Stephan Das Zipfsche Gesetz und seine Implikationen fur urbane Regionen PDF 283 kB Einzelnachweise Bearbeiten Christian Schluter Mark Trede 12 September 2013 Gibrat Zipf Fisher and Tippett City Size and Growth Distributions Reconsidered PDF 494 kB 29 Seiten oder im Internetarchiv Memento vom 10 Juni 2016 im Internet Archive abgerufen am 29 Juli 2018 Diskrete univariate Verteilungen Diskrete univariate Verteilungen fur endliche Mengen Benford Bernoulli beta binomial binomial Dirac diskret uniform empirisch hypergeometrisch kategorial negativ hypergeometrisch Rademacher verallgemeinert binomial Zipf Zipf Mandelbrot ZweipunktDiskrete univariate Verteilungen fur unendliche Mengen Boltzmann Conway Maxwell Poisson discrete Phase Type erweitert negativ binomial Gauss Kuzmin gemischt Poisson geometrisch logarithmisch negativ binomial parabolisch fraktal Poisson Skellam verallgemeinert Poisson Yule Simon ZetaKontinuierliche univariate Verteilungen Kontinuierliche univariate Verteilungen mit kompaktem Intervall Beta Cantor Kumaraswamy raised Cosine Dreieck Trapez U quadratisch stetig uniform Wigner HalbkreisKontinuierliche univariate Verteilungen mit halboffenem Intervall Beta prime Bose Einstein Burr Chi Quadrat Coxian Erlang Exponential Extremwert F Fermi Dirac Folded normal Frechet Gamma Gamma Gamma verallgemeinert invers Gauss halblogistisch halbnormal Hartman Watson Hotellings T Quadrat hyper exponentiale hypoexponential invers Chi Quadrat scale invers Chi Quadrat Invers Normal Invers Gamma Kolmogorow Verteilung Levy log normal log logistisch Maxwell Boltzmann Maxwell Speed Nakagami nichtzentriert Chi Quadrat Pareto Phase Type Rayleigh relativistisch Breit Wigner Rice Rosin Rammler shifted Gompertz truncated normal Type 2 Gumbel Weibull Wilks LambdaKontinuierliche univariate Verteilungen mit unbeschranktem Intervall Cauchy Extremwert exponential Power Fishers z Fisher Tippett Gumbel generalized hyperbolic Hyperbolic secant Landau Laplace alpha stabil logistisch normal Gauss normal invers Gauss sch Skew normal Studentsche t Type 1 Gumbel Variance Gamma VoigtMultivariate Verteilungen Diskrete multivariate Verteilungen Dirichlet compound multinomial Ewens gemischt Multinomial multinomial multivariat hypergeometrisch multivariat Poisson negativmultinomial Polya Eggenberger polyhypergeometrischKontinuierliche multivariate Verteilungen Dirichlet GEM generalized Dirichlet multivariat normal multivariat Student normalskaliert invers Gamma Normal Gamma Poisson DirichletMultivariate Matrixverteilungen Invers Wishart Matrix Beta Matrix Gamma Matrix invers Beta Matrix invers Gamma Matrix Normal Matrix Student t Normal invers Wishart Normal Wishart Wishart Normdaten Sachbegriff GND 4190937 9 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Zipfsches Gesetz amp oldid 233035920