www.wikidata.de-de.nina.az
Ein Konfidenzintervall kurz KI auch Vertrauensintervall Konfidenzbereich Vertrauensbereich oder Erwartungsbereich genannt ist in der frequentistischen Statistik ein Intervall das die Prazision der Lageschatzung eines Parameters z B eines Mittelwerts angeben soll Das Konfidenzintervall gibt den Wertebereich an der mit einer gewissen Wahrscheinlichkeit den Parameter der Verteilung einer Zufallsvariablen einschliesst Diese Wahrscheinlichkeit wird durch das Konfidenzniveau auch Konfidenzkoeffizient genannt festgelegt und entspricht der nominalen Uberdeckungswahrscheinlichkeit Ein haufig verwendetes Konfidenzniveau ist 95 Konfidenzintervalle zum Niveau 95 fur 100 Stichproben vom Umfang 30 aus einer normalverteilten Grundgesamtheit Davon uberdecken 94 Intervalle den exakten Erwartungswert m 5 die ubrigen 6 tun das nicht Die haufig anzutreffende Formulierung dass der wahre Wert mit 95 Wahrscheinlichkeit im fur die vorliegende Stichprobe berechneten Konfidenzintervall liegt ist streng genommen nicht korrekt 1 2 da der wahre Wert keine Zufallsgrosse d h nicht stochastisch ist Stochastisch sind vielmehr die obere und untere Grenze des Konfidenzintervalls Folglich lautet die korrekte Formulierung Bei der Berechnung eines Konfidenzintervalls mit einem bestimmten Schatzverfahren enthalt das Intervall den wahren Wert mit 95 Wahrscheinlichkeit Es handelt sich nicht um eine Eigenschaft des Intervalls sondern des Verfahrens Wird es fur viele Stichproben aus derselben Grundgesamtheit wiederholt so sollte es Konfidenzintervalle liefern die den wahren Wert b j displaystyle beta j naherungsweise mit einer dem Konfidenzniveau 1 a displaystyle 1 alpha entsprechenden relativen Haufigkeit uberdecken Das Schatzen von Parametern mit Hilfe von Konfidenzintervallen wird Intervallschatzung genannt die entsprechende Schatzfunktion ein Bereichs oder Intervallschatzer Ein Vorteil gegenuber Punktschatzern ist dass man an einem Konfidenzintervall direkt die Signifikanz ablesen kann Ein fur ein vorgegebenes Konfidenzniveau breites Intervall weist auf einen geringen Stichprobenumfang oder auf eine starke Variabilitat in der Grundgesamtheit hin Abzugrenzen von Konfidenzintervallen sind Prognoseintervalle sowie Konfidenz und Vorhersagebander Inhaltsverzeichnis 1 Definition 2 Formale Definition 2 1 Rahmenbedingungen 2 2 Konfidenzbereich 2 3 Konfidenzintervall 2 4 Konfidenzniveau und Irrtumsniveau 3 Konstruktion von Konfidenzintervallen 3 1 Konstruktion des Wald Konfidenzintervalls 3 1 1 Beispiel 3 2 Konstruktion anderer Konfidenzintervalle 4 Beschreibung des Verfahrens 5 Beispiel 6 Ausgewahlte Schatzintervalle 6 1 Ubersicht fur stetige Verteilungen 6 2 Diskrete Verteilungen 7 Konfidenzintervalle und Hypothesentests 8 Beispiele fur ein Konfidenzintervall 9 Literatur 10 Weblinks 11 EinzelnachweiseDefinition BearbeitenFur ein fest vorgegebenes g 0 1 displaystyle gamma in 0 1 nbsp ist ein g 100 displaystyle gamma cdot 100 nbsp Konfidenzintervall fur Ď‘ displaystyle vartheta nbsp zum Konfidenzniveau g displaystyle gamma nbsp auch g displaystyle gamma nbsp Konfidenzintervall durch die beiden auf einer Zufallsstichprobe X 1 n displaystyle X 1 n nbsp basierenden Statistiken T u h u X 1 n displaystyle T u h u X 1 n nbsp und T v h v X 1 n displaystyle T v h v X 1 n nbsp definiert welche 3 P T u Ď‘ T v g f u r a l l e Ď‘ 8 displaystyle P left T u leq vartheta leq T v right gamma quad mathrm f ddot u r alle vartheta in Theta nbsp erfullen Die Statistiken T u displaystyle T u nbsp und T v displaystyle T v nbsp sind die Grenzen des Konfidenzintervalls fur die stets T u lt T v displaystyle T u lt T v nbsp angenommen wird Die Realisierungen t u displaystyle t u nbsp und t v displaystyle t v nbsp von T u displaystyle T u nbsp bzw T v displaystyle T v nbsp bilden das Schatzintervall t u t v displaystyle t u t v nbsp Die Grenzen des Konfidenzintervalls sind Funktionen der Zufallsstichprobe X 1 n displaystyle X 1 n nbsp und daher ebenfalls zufallig Im Gegensatz dazu ist der unbekannte Parameter Ď‘ displaystyle vartheta nbsp fest Wenn man das Zufallsexperiment auf identische Art und Weise wiederholt dann wird ein g 100 displaystyle gamma cdot 100 nbsp Konfidenzintervall den unbekannten Parameter Ď‘ displaystyle vartheta nbsp in g 100 displaystyle gamma cdot 100 nbsp aller Falle uberdecken Da der unbekannte Parameter Ď‘ displaystyle vartheta nbsp keine Zufallsvariable ist kann man allerdings nicht sagen dass Ď‘ displaystyle vartheta nbsp in einem g 100 displaystyle gamma cdot 100 nbsp Konfidenzintervall mit Wahrscheinlichkeit g displaystyle gamma nbsp liegt Solch eine Interpretation ist dem bayesschen Pendant von Konfidenzintervall den sogenannten Glaubwurdigkeitsintervallen vorbehalten 4 Oft setzt man g 1 a displaystyle gamma 1 alpha nbsp Die Wahrscheinlichkeit 1 a displaystyle 1 alpha nbsp lasst sich als relative Haufigkeit interpretieren Verwendet man fur eine grosse Anzahl von Konfidenzschatzungen Intervalle die jeweils das Niveau 1 a displaystyle 1 alpha nbsp besitzen so nahert sich die relative Haufigkeit mit denen die konkreten Intervalle den Parameter uberdecken dem Wert 1 a displaystyle 1 alpha nbsp 5 Formale Definition BearbeitenRahmenbedingungen Bearbeiten Gegeben sei ein statistisches Modell X A P Ď‘ Ď‘ 8 displaystyle X mathcal A P vartheta vartheta in Theta nbsp sowie eine Funktion g 8 G displaystyle g colon Theta to Gamma nbsp die im parametrischen Fall auch Parameterfunktion genannt wird Die Menge G displaystyle Gamma nbsp enthalt die Werte die Ergebnis einer Schatzung sein konnen Meist ist G R n displaystyle Gamma subset mathbb R n nbsp Konfidenzbereich Bearbeiten Eine Abbildung C X P G displaystyle C colon X to mathcal P Gamma nbsp heisst ein Konfidenzbereich Vertrauensbereich 6 Bereichsschatzfunktion 7 oder ein Bereichsschatzer 6 wenn sie die folgende Bedingung erfullt Fur alle g G displaystyle gamma in Gamma nbsp ist die Menge A g x X g C x displaystyle A gamma x in X mid gamma in C x nbsp in A displaystyle mathcal A nbsp enthalten M Ein Konfidenzbereich ist also eine Abbildung die jeder Beobachtung x X displaystyle x in X nbsp eine vorerst beliebige Teilmenge von G displaystyle Gamma nbsp zuordnet P G displaystyle mathcal P Gamma nbsp ist hier die Potenzmenge der Menge G displaystyle Gamma nbsp also die Menge aller Teilmengen von G displaystyle Gamma nbsp Die Bedingung M stellt sicher dass allen Mengen A g displaystyle A gamma nbsp eine Wahrscheinlichkeit zugeordnet werden kann Dies wird zur Definition des Konfidenzniveaus benotigt Konfidenzintervall Bearbeiten Ist G R displaystyle Gamma subset mathbb R nbsp und ist C x displaystyle C x nbsp fur jedes x X displaystyle x in X nbsp immer ein Intervall so heisst C displaystyle C nbsp auch ein Konfidenzintervall 6 Werden Konfidenzintervalle in der Form C 1 x b x C 2 x b x b x oder C 3 x b x displaystyle C 1 x infty b x C 2 x b x b x text oder C 3 x b x infty nbsp definiert so nennt man b x displaystyle b x nbsp auch die obere Konfidenzschranke und b x displaystyle b x nbsp die untere Konfidenzschranke 8 Konfidenzniveau und Irrtumsniveau Bearbeiten Gegeben sei ein Konfidenzbereich C displaystyle C nbsp Dann heisst C displaystyle C nbsp ein Konfidenzbereich zum Konfidenzniveau 7 oder Sicherheitsniveau 6 1 a displaystyle 1 alpha nbsp wenn P Ď‘ x X g Ď‘ C x 1 a f u r a l l e Ď‘ 8 displaystyle P vartheta x in X mid g vartheta in C x geq 1 alpha quad mathrm f ddot u r alle vartheta in Theta nbsp Der Wert a displaystyle alpha nbsp wird dann auch das Irrtumsniveau 6 genannt Eine allgemeinere Formulierung ist mit Formhypothesen moglich siehe Formhypothesen Konfidenzbereiche zu Formhypothesen Fur die oben genannten Spezialfalle bei Konfidenzbereichen mit oberer und unterer Konfidenzschranke ergibt sich somit P Ď‘ g Ď‘ b x 1 a displaystyle P vartheta g vartheta leq b x geq 1 alpha nbsp bzw P Ď‘ b x g Ď‘ b x 1 a displaystyle P vartheta b x leq g vartheta leq b x geq 1 alpha nbsp und P Ď‘ b x g Ď‘ 1 a f u r a l l e Ď‘ 8 displaystyle P vartheta b x leq g vartheta geq 1 alpha quad mathrm f ddot u r alle vartheta in Theta nbsp Konstruktion von Konfidenzintervallen BearbeitenSiehe auch Schatzung der Varianz einer Schatzfunktion Konstruktion des Wald Konfidenzintervalls Bearbeiten Wald Konfidenzintervalle konnen mittels der sogenannten Wald Statistik berechnet werden Beispielsweise gilt fur das asymptotische Wald Konfidenzintervall dass es mittels der Fisher Information der negativen zweiten Ableitung der Log Likelihood Funktion konstruiert werden kann 9 So umschliessen die Intervallgrenzen des folgenden Konfidenzintervalls in 95 der Falle den wahren Parameter 8 displaystyle theta nbsp asymptotisch fur grosse Stichprobenumfange 8 M L 1 96 1 2 8 2 â„“ 8 M L displaystyle hat theta ML pm 1 96 frac 1 sqrt frac partial 2 partial theta 2 ell hat theta ML nbsp wobei â„“ log L displaystyle ell cdot log mathcal L cdot nbsp die Log Likelihood Funktion und 2 8 2 â„“ 8 M L displaystyle frac partial 2 partial theta 2 ell hat theta ML nbsp die beobachtete Fisher Information darstellt die Fisher Information an der Stelle des ML Schatzers 8 M L displaystyle hat theta ML nbsp Der Ausdruck 1 2 8 2 â„“ 8 M L displaystyle frac 1 sqrt frac partial 2 partial theta 2 ell hat theta ML nbsp wird auch als Standardfehler des Maximum Likelihood Schatzers bezeichnet 9 Haufig wird statt der beobachteten Fisher Information auch die erwartete Fisher Information E 2 8 2 â„“ 8 M L displaystyle operatorname E left frac partial 2 partial theta 2 ell hat theta ML right nbsp verwendet 9 Beispiel Bearbeiten Wird die Likelihood zum Beispiel mithilfe einer angenommenen Normalverteilung und einer Stichprobe deren Variablen unabhangig und identisch verteilte Zufallsvariablen sind mit Grosse N displaystyle N nbsp berechnet so ist 2 m 2 â„“ m s 2 m 2 i 1 N x i m 2 2 s 2 m m s s i 1 N 1 s 2 N s 2 displaystyle frac partial 2 partial mu 2 ell hat mu hat sigma left frac partial 2 partial mu 2 sum i 1 N frac x i mu 2 2 sigma 2 right mu hat mu sigma hat sigma sum i 1 N frac 1 hat sigma 2 frac N hat sigma 2 nbsp und somit 1 2 8 2 â„“ 8 M L 1 N s 2 s N displaystyle frac 1 sqrt frac partial 2 partial theta 2 ell hat theta ML frac 1 sqrt frac N hat sigma 2 frac hat sigma sqrt N nbsp also der bekannte Standardfehler des Mittelwertes Konstruktion anderer Konfidenzintervalle Bearbeiten Konfidenzintervalle lassen sich auch mithilfe von alternativen Parametrisierungen der Log Likelihood Funktion finden zum Beispiel kann die Logit Transformation oder der Logarithmus verwendet werden Dies ist vorteilhaft wenn die Log Likelihood Funktion sehr schief ist Auch mithilfe des Likelihood Quotienten konnen Konfidenzintervalle konstruiert werden 9 Eine nichtparametrische Art Konfidenzintervalle zu schatzen sind Bootstrap Konfidenzintervalle bei denen man keine Verteilung annehmen muss sondern Bootstrapping benutzt Beschreibung des Verfahrens BearbeitenMan interessiert sich fur den unbekannten Parameter Ď‘ displaystyle vartheta nbsp einer Grundgesamtheit Dieser wird durch eine Schatzfunktion aus einer Stichprobe vom Umfang n displaystyle n nbsp geschatzt Es wird davon ausgegangen dass die Stichprobe eine einfache Zufallsstichprobe ist in etwa die Grundgesamtheit widerspiegelt und dass deshalb die Schatzung in der Nahe des wahren Parameters liegen musste Die Schatzfunktion ist eine Zufallsvariable mit einer Verteilung die den Parameter Ď‘ displaystyle vartheta nbsp enthalt Man kann zunachst mit Hilfe der Verteilung ein Intervall angeben das den unbekannten wahren Parameter Ď‘ displaystyle vartheta nbsp mit einer Wahrscheinlichkeit g 1 a displaystyle gamma 1 alpha nbsp uberdeckt Ermitteln wir z B das 95 Konfidenzintervall fur den wahren Erwartungswert m displaystyle mu nbsp einer Grundgesamtheit dann bedeutet dies dass wir ein Konfidenzintervall ermitteln das bei durchschnittlich 95 von 100 gleich grossen Zufallsstichproben den Erwartungswert enthalt Beispiel BearbeitenDas Verfahren kann anhand eines normalverteilten Merkmals mit dem unbekannten Erwartungswert m displaystyle mu nbsp und der bekannten Varianz s 2 displaystyle sigma 2 nbsp demonstriert werden Es soll der Erwartungswert m displaystyle mu nbsp dieser Normalverteilung geschatzt werden Verwendet wird die erwartungstreue Schatzfunktion der Stichprobenmittelwert X displaystyle overline X nbsp nbsp Zentrales Schwankungsintervall von X displaystyle overline X nbsp Der Erwartungswert der Grundgesamtheit wird anhand unserer Stichprobe geschatzt Schatzfunktion X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i nbsp Punktschatzung m x 1 n i 1 n x i displaystyle hat mu overline x frac 1 n sum i 1 n x i nbsp wobei die Zufallsvariable X i displaystyle X i nbsp i 1 n displaystyle i 1 dotsc n nbsp fur die i te Beobachtung vor der Ziehung der Stichprobe steht Der Stichprobenmittelwert folgt einer Normalverteilung mit Erwartungswert m displaystyle mu nbsp und Varianz Var X s 2 n displaystyle operatorname Var overline X frac sigma 2 n nbsp siehe Stichprobenmittel Eigenschaften X N m s 2 n displaystyle overline X sim mathcal N left mu frac sigma 2 n right nbsp Die Grenzen des zentralen Schwankungsintervalls x u x o displaystyle overline x u overline x o nbsp das m displaystyle mu nbsp mit der Wahrscheinlichkeit 1 a displaystyle 1 alpha nbsp uberdeckt bestimmen sich aus der Beziehung P x u X x o 1 a displaystyle P overline x u leq overline X leq overline x o 1 alpha nbsp Man standardisiert zur Standardnormalverteilung N 0 1 displaystyle mathcal N 0 1 nbsp und erhalt fur die standardisierte Zufallsvariable Z X m s n displaystyle Z frac overline X mu sigma sqrt n nbsp die Wahrscheinlichkeit P z 1 a 2 X m s n z 1 a 2 1 a displaystyle P left z left 1 tfrac alpha 2 right leq frac overline X mu sigma sqrt n leq z left 1 tfrac alpha 2 right right 1 alpha nbsp wobei z 1 a 2 displaystyle textstyle z left 1 frac alpha 2 right nbsp das 1 a 2 displaystyle 1 tfrac alpha 2 nbsp Quantil der Standardnormalverteilung ist Lost man nach dem unbekannten Parameter m displaystyle mu nbsp auf so ergibt sich aus P X z 1 a 2 s n m X z 1 a 2 s n 1 a displaystyle P left overline X z left 1 tfrac alpha 2 right frac sigma sqrt n leq mu leq overline X z left 1 tfrac alpha 2 right frac sigma sqrt n right 1 alpha nbsp das 1 a displaystyle 1 alpha nbsp Konfidenzintervall fur m displaystyle mu nbsp nbsp Mogliche Lage des unbekannten Parameter m displaystyle mu nbsp im Schatzintervall um das beobachtete x displaystyle overline x nbsp K I 1 a m X z 1 a 2 s n X z 1 a 2 s n displaystyle KI 1 alpha mu left overline X z left 1 tfrac alpha 2 right frac sigma sqrt n overline X z left 1 tfrac alpha 2 right frac sigma sqrt n right nbsp Das Schatzintervall die Realisierung eines Konfidenzintervalles anhand einer konkreten Stichprobe ergibt sich dann als x z 1 a 2 s n x z 1 a 2 s n displaystyle left overline x z left 1 tfrac alpha 2 right frac sigma sqrt n overline x z left 1 tfrac alpha 2 right frac sigma sqrt n right nbsp Die Grenzen des Schatzintervalles hangen jedoch von x displaystyle overline x nbsp ab und andern sich damit von Stichprobe zu Stichprobe Ist die Stichprobe aber extrem ausgefallen uberdeckt das Intervall den Parameter nicht Dies ist in a 100 aller Stichproben der Fall d h das durch x displaystyle overline x nbsp bestimmte Intervall uberdeckt den wahren Parameter m displaystyle mu nbsp also mit einer Wahrscheinlichkeit von 1 a displaystyle 1 alpha nbsp Von besonderem Interesse ist die Breite des Konfidenzintervalls Diese bestimmt sich durch die Standardabweichung der Schatzfunktion und das gewahlte Konfidenzniveau Durch Erhohung des Stichprobenumfangs kann die Breite verringert werden Erwunscht ist in der Regel ein moglichst schmales Konfidenzintervall denn dies weist bei konstantem Konfidenzniveau auf eine genaue Schatzung hin Als absoluter Fehler e displaystyle e nbsp wird die halbe Breite des Konfidenzintervalls bezeichnet Im obigen Fall gilt also e z 1 a 2 s n displaystyle e z left 1 frac alpha 2 right frac sigma sqrt n nbsp Der absolute Fehler ist ein Mass fur die Genauigkeit der Schatzung Breite des Konfidenzintervalls 2 e displaystyle 2e nbsp Der absolute Fehler ist von Bedeutung wenn bei einem gegebenen Konfidenzintervall und einer gegebenen Konfidenzintervalllange der benotigte Stichprobenumfang n displaystyle n nbsp ermittelt werden soll Die Frage lautet also Welchen Stichprobenumfang benotigt man um einen Parameter z B arithmetisches Mittel mit vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schatzen Enthalt die zugrundeliegende Stichprobe korrelierte Daten so ist dies in der Schatzung der Standardabweichung s displaystyle sigma nbsp zu berucksichtigen Wird dies nicht berucksichtigt so stosst man auf das Problem der Pseudoreplikation nbsp Pseudoreplikation wegen korrelierter Daten ohne Berucksichtigung der Korrelation ist das 90 Konfidenzintervall des Stichprobenmittelwertes zu klein Blocking kann fur eine bessere Schatzung von s displaystyle sigma nbsp verwendet werden Ausgewahlte Schatzintervalle BearbeitenUbersicht fur stetige Verteilungen Bearbeiten Eine Ubersicht uber alle Falle bei normalverteilten Merkmalen findet sich unter Normalverteilungsmodell Erwartungswert eines normalverteilten Merkmals mit bekannter Varianz s 2 displaystyle sigma 2 nbsp z 1 a 2 displaystyle textstyle z 1 tfrac alpha 2 nbsp ist das 1 a 2 displaystyle 1 alpha 2 nbsp Quantil der Standardnormalverteilung x z 1 a 2 s n x z 1 a 2 s n displaystyle left overline x z 1 tfrac alpha 2 frac sigma sqrt n overline x z 1 tfrac alpha 2 frac sigma sqrt n right nbsp Erwartungswert eines normalverteilten Merkmals mit unbekannter Varianz Die Varianz der Grundgesamtheit wird durch die korrigierte Stichprobenvarianz s 2 1 n 1 x i x 2 displaystyle s 2 tfrac 1 n 1 sum x i overline x 2 nbsp geschatzt t 1 a 2 n 1 displaystyle textstyle t 1 tfrac alpha 2 n 1 nbsp ist das 1 a 2 displaystyle 1 alpha 2 nbsp Quantil der t Verteilung mit n 1 displaystyle n 1 nbsp Freiheitsgraden Fur n gt 30 displaystyle n gt 30 nbsp kann das Quantil der t Verteilung naherungsweise durch das entsprechende Quantil der Standardnormalverteilung ersetzt werden x t 1 a 2 n 1 s n x t 1 a 2 n 1 s n displaystyle left overline x t 1 tfrac alpha 2 n 1 frac s sqrt n overline x t 1 tfrac alpha 2 n 1 frac s sqrt n right nbsp Erwartungswert eines unbekannt verteilten Merkmals mit unbekannter Varianz Falls n displaystyle n nbsp genugend gross ist kann aufgrund des zentralen Grenzwertsatzes das Konfidenzintervall bestimmt werden x z 1 a 2 s n x z 1 a 2 s n displaystyle left overline x z 1 tfrac alpha 2 frac s sqrt n overline x z 1 tfrac alpha 2 frac s sqrt n right nbsp Standardabweichung eines normalverteilten Merkmals x p k 2 displaystyle mathcal chi p k 2 nbsp ist das p Quantil der Chi Quadrat Verteilung mit k displaystyle k nbsp Freiheitsgraden s n 1 x 1 a 2 n 1 2 s n 1 x a 2 n 1 2 displaystyle left s sqrt frac n 1 chi 1 tfrac alpha 2 n 1 2 s sqrt frac n 1 chi tfrac alpha 2 n 1 2 right nbsp Diskrete Verteilungen Bearbeiten Konfidenzintervalle fur den Parameter p der Binomialverteilung sind beschrieben in dem Hauptartikel Konfidenzintervall fur die Erfolgswahrscheinlichkeit der Binomialverteilung Das sogenannte Clopper Pearson Konfidenzintervall kann mit Hilfe der Beta oder F Verteilung bestimmt werden Dieses Konfidenzintervall wird auch exakt genannt da das geforderte Konfidenzniveau tatsachlich eingehalten wird Bei Naherungsmethoden die meistens auf der Approximation der Binomialverteilung durch die Normalverteilung basieren wird das Konfidenzniveau oft nicht eingehalten Ist die Zahl der Elemente in der Grundgesamtheit bekannt kann fur den Parameter mit Hilfe eines Korrekturfaktors auch ein Konfidenzintervall fur ein Urnenmodell ohne Zurucklegen angegeben werden 10 Konfidenzintervalle und Hypothesentests Bearbeiten Hauptartikel Dualitat von Tests und Konfidenzbereichen Die Begriffe Konfidenzbereich und statistischer Test sind dual zueinander unter allgemeinen Bedingungen konnen aus einem Konfidenzbereich fur einen Parameter statistische Tests fur entsprechende Punkthypothesen gewonnen werden und umgekehrt Testet man von einem Parameter Ď‘ displaystyle vartheta nbsp die Nullhypothese Ď‘ Ď‘ 0 displaystyle vartheta vartheta 0 nbsp dann wird die Nullhypothese bei einem Signifikanzniveau a displaystyle alpha nbsp nicht abgelehnt wenn das entsprechende 1 a displaystyle 1 alpha nbsp Konfidenzintervall berechnet mit den gleichen Daten den Wert Ď‘ 0 displaystyle vartheta 0 nbsp enthalt Daher ersetzen Konfidenzintervalle gelegentlich auch Hypothesentests nbsp Die Ablehnung der Nullhypothese m X displaystyle mu overline X nbsp wurde genau dann erfolgen wenn m displaystyle mu nbsp ausserhalb des Konfidenzintervalls von X displaystyle overline X nbsp liegen wurde Dann ware die Wahrscheinlichkeit eine mindestens so grosse Differenz m X displaystyle mu overline X nbsp zu beobachten der p Wert klein Analog lasst sich feststellen falls ein Test eine niedrige Trennscharfe hat bzw das entsprechende Konfidenzintervall grosser als notig beim gewahlten Signifikanz Niveau ist so sind beide nicht effizient Beispielsweise testet man in der Regressionsanalyse ob im multiplen linearen Regressionsmodell mit der geschatzten Regressionshyperebene y b 0 b 1 x 1 b 2 x 2 b k x k displaystyle hat y b 0 b 1 x 1 b 2 x 2 ldots b k x k nbsp die wahren Regressionskoeffizienten b j j 1 k displaystyle beta j j 1 ldots k nbsp gleich Null sind siehe Globaler F Test Wenn die Hypothese nicht abgelehnt wird sind die entsprechenden Regressoren x j j 1 k displaystyle x j j 1 ldots k nbsp vermutlich fur die Erklarung der abhangigen Variablen y displaystyle y nbsp unerheblich Eine entsprechende Information liefert das Konfidenzintervall fur einen Regressionskoeffizienten Uberdeckt das Konfidenzintervall die Null 0 K I 1 a b j displaystyle left 0 in KI 1 alpha beta j right nbsp so ist bei einem Signifikanzniveau a displaystyle alpha nbsp der Regressionskoeffizient statistisch nicht verschieden von 0 displaystyle 0 nbsp Die Begriffe der Unverfalschtheit und des gleichmassig besten Tests lassen sich hieruber auf Konfidenzbereiche ubertragen Beispiele fur ein Konfidenzintervall BearbeitenBeispiel 1Ein Unternehmen mochte ein neues Spulmittel einfuhren Um die Kauferakzeptanz auszuloten wird das Spulmittel in einem Test Supermarkt platziert Mit dieser Aktion soll der durchschnittliche tagliche Absatz in einem Supermarkt dieser Grosse geschatzt werden Man definiert nun den taglichen Absatz als Zufallsvariable X displaystyle X nbsp Stuck mit den unbekannten Parametern Erwartungswert m displaystyle mu nbsp und Varianz s 2 displaystyle sigma 2 nbsp Man geht auf Grund langjahriger Beobachtungen hier davon aus dass X displaystyle X nbsp annahernd normalverteilt ist Die Marktforschungsabteilung hat ein Konfidenzniveau von 0 95 95 als ausreichend erachtet Dann wird 16 Tage lang der tagliche Absatz erfasst Es ergibt sich Tag 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16Absatz x displaystyle x nbsp 110 112 106 90 96 118 108 114 107 90 85 84 113 105 90 104Bei normalverteilter Grundgesamtheit mit unbekannter Varianz wird das Konfidenzintervall fur den Erwartungswert angegeben als x t 1 a 2 n 1 s n x t 1 a 2 n 1 s n displaystyle left overline x t left 1 frac alpha 2 n 1 right frac s sqrt n overline x t left 1 frac alpha 2 n 1 right frac s sqrt n right nbsp Es ist das Mittel der Stichprobe x 1 16 110 112 104 1 16 1632 102 displaystyle overline x frac 1 16 cdot 110 112 dotsb 104 frac 1 16 cdot 1632 102 nbsp und die Varianz der Stichprobe s 2 1 n 1 i 1 n x i x 2 1 15 110 102 2 112 102 2 104 102 2 1 15 1856 123 73 displaystyle begin aligned s 2 amp frac 1 n 1 sum i 1 n x i overline x 2 amp frac 1 15 left 110 102 2 112 102 2 dotsb 104 102 2 right amp frac 1 15 cdot 1856 123 73 end aligned nbsp Es ist das 1 a 2 displaystyle 1 alpha 2 nbsp Quantil der t Verteilung mit 15 Freiheitsgraden t 1 a 2 n 1 t 0 975 15 2 131 displaystyle t left 1 frac alpha 2 n 1 right t left 0 975 15 right 2 131 nbsp Der Wert fur t ist nicht trivial zu errechnen und muss daher aus einer Tabelle abgelesen werden Das 95 Konfidenzintervall berechnet sich dann als 102 2 131 123 73 16 102 2 131 123 73 16 102 5 93 102 5 93 96 07 107 93 displaystyle left 102 2 131 frac sqrt 123 73 sqrt 16 102 2 131 frac sqrt 123 73 sqrt 16 right 102 5 93 102 5 93 96 07 107 93 nbsp Im Mittel enthalten 95 der so geschatzten Intervalle den wahren Mittelwert m displaystyle mu nbsp also den durchschnittlichen Tagesabsatz an Spulmittelflaschen in vergleichbaren Supermarkten Fur dieses konkrete Intervall trifft die Aussage dass es mit 95 Wahrscheinlichkeit den wahren Mittelwert enthalt jedoch nicht zu Man weiss lediglich dass dieses Intervall aus einer Menge von Intervallen stammt von denen 95 den wahren Mittelwert enthalten Beispiel 2Ein Unternehmen lieferte ein Los eine Charge von 6000 Stuck z B Schrauben an den Kunden Dieser fuhrt mittels Stichprobennahme gemass der internationalen Norm ISO 2859 1 11 eine Eingangsprufung durch Dabei werden z B 200 Schrauben je nach gewahltem AQL zufallig uber das gesamte Los gezogen und auf Ubereinstimmung mit den vereinbarten Anforderungen Qualitatsmerkmalen gepruft Von den 200 gepruften Schrauben erfullen 10 Stuck die gestellten Anforderungen nicht Mittels der Berechnung des Konfidenzintervalls Excel Funktion BETAINV kann der Kunde abschatzen wie gross der zu erwartende Anteil fehlerhafter Schrauben im ganzen Los ist bei einem Konfidenzniveau von 95 berechnet man das Clopper Pearson Konfidenzintervall 2 4 9 fur den Anteil fehlerhafter Schrauben im Los Parameter n 200 k 10 Literatur BearbeitenUlrich Krengel Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 8 Auflage Vieweg 2005 Joachim Hartung Statistik 14 Auflage Oldenbourg 2005 Weblinks BearbeitenKonfidenzintervalle und Hypothesentests Konfidenzintervalle so einfach wie moglich erklart PDF 109 kB Java Applet fur die Auswertung eigener Messreihen Interaktive VeranschaulichungEinzelnachweise Bearbeiten Significance Test Controversy englisch What is the Real Result in the Target Population In Statistics in Brief Confidence Intervals PMC 2947664 freier Volltext englisch Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg u a 2014 ISBN 978 3 642 37886 7 S 56 Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg u a 2014 ISBN 978 3 642 37886 7 S 57 Karl Mosler und Friedrich Schmid Wahrscheinlichkeitsrechnung und schliessende Statistik Springer Verlag 2011 S 214 a b c d e Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 S 229 doi 10 1515 9783110215274 a b Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 230 231 doi 10 1007 978 3 642 41997 3 Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 245 doi 10 1007 978 3 642 41997 3 a b c d Supplement Loglikelihood and Confidence Intervals Abgerufen am 14 Juli 2021 Siehe zum Beispiel Kap IV Abschnitte 3 1 1 und 3 2 bei Hartung Hier werden die Wilson und Clopper Pearson Intervalle sowie der Korrekturfaktor fur die hypergeometrische Verteilung besprochen Annahmestichprobenprufung anhand der Anzahl fehlerhaften Einheiten oder Fehler Attributprufung Teil 1 Nach der annehmbaren Qualitatsgrenzlage AQL geordnete Stichprobenplane fur die Prufung einer Serie von Losen Abgerufen von https de wikipedia org w index php title Konfidenzintervall amp oldid 236427794