www.wikidata.de-de.nina.az
In der Statistik dient der G Test der Prufung ob die Haufigkeiten in einer Kontingenztafel durch den Zufall zustande gekommen sind oder nicht Der G Test lost in vielen Bereichen insbesondere aber in der Computerlinguistik den alteren Chi Quadrat Test ab Wie beim Chi Quadrat Test teilt man die Auspragungen des Merkmals X displaystyle X in m displaystyle m Kategorien ein und zahlt wie oft das Merkmal in jede von diesen Kategorien fallt Die Formel zur Berechnung der Prufstatistik G lautet wie folgt G 2 i 1 m N i ln N i n 0 i displaystyle G 2 sum i 1 m N i cdot ln left frac N i n 0i right N i displaystyle N i ist die beobachtete Haufigkeit mit der das Merkmal in die i displaystyle i te Kategorie fallt n 0 i displaystyle n 0i ist die erwartete Haufigkeit derselben Zelle unter Annahme der Nullhypothese und ln displaystyle ln ist der naturliche Logarithmus Das Summenzeichen addiert die Ergebnisse fur alle m displaystyle m Kategorien Die Prufstatistik G displaystyle G ist annahernd Chi Quadrat verteilt mit m 1 displaystyle m 1 Freiheitsgraden Vergleich mit dem Chi Quadrat Test BearbeitenBeide Tests losen dasselbe statistische Problem der Chi Quadrat Test besitzt jedoch als aufwandigsten Rechenschritt eine Quadrierung wahrend der G Test den Logarithmus berechnet Der Chi Quadrat Test verdankt seine Beliebtheit somit der einfachen Berechnung die bei kleinen Kontingenztafeln ohne Weiteres von Hand vorgenommen werden kann Hinzu kommt dass der Chi Quadrat Test schon seit jeher in grundlegenden Statistik Lehrbuchern behandelt wird Fur Chi Quadrat Tests gilt die Faustregel dass der Haufigkeitswert pro Zelle mindestens 5 betragen muss Der G Test ist bei kleinen Stichproben robuster Literatur Bearbeitenarxiv 1206 4881 abs Abgerufen von https de wikipedia org w index php title G Test amp oldid 193044279