www.wikidata.de-de.nina.az
Als mathematische Statistik bezeichnet man das Teilgebiet der Statistik das die Methoden und Verfahren der Statistik mit mathematischen Mitteln analysiert beziehungsweise mit ihrer Hilfe erst begrundet Meist weitgehend synonym werden die Begriffe induktive Statistik beurteilende Statistik und Inferenzstatistik schliessende Statistik gebraucht die den zur beschreibenden Statistik komplementaren Teil der Statistik charakterisieren Gemeinsam mit der Wahrscheinlichkeitstheorie bildet die mathematische Statistik das als Stochastik bezeichnete Teilgebiet der Mathematik Die mathematische Grundlage der mathematischen Statistik ist die Wahrscheinlichkeitstheorie Inhaltsverzeichnis 1 Ziele der Statistik 2 Methodik 2 1 Prinzipielles Vorgehen der Mathematischen Statistik 2 2 Schatztheorie 2 3 Hypothesentest 2 4 Methoden zur Kausalergrundung 2 5 Statistische Auswahlverfahren 2 6 Bayessche Statistik 3 Praktische Durchfuhrung von statistischen Methoden 4 Mathematischer Formalismus und mathematische Grundlagen 4 1 Statistisches Modell 4 2 Mathematische Grundlagen 5 Geschichte der Mathematischen Statistik 6 Literatur 7 Einzelnachweise 8 WeblinksZiele der Statistik BearbeitenGegenstand der Statistik sind Grundgesamtheiten deren Mitglieder allesamt ein bestimmtes Merkmal aufweisen Gesucht sind Aussagen daruber wie haufig dieses Merkmal innerhalb der Grundgesamtheit seine moglichen Werte annimmt Oft beschranken sich die Aussagen auf abgeleitete Grossen wie zum Beispiel den Durchschnitt der Merkmalswerte die die Mitglieder der Grundgesamtheit besitzen Alterspyramide Verteilung der Merkmale Geschlecht und Alter in der deutschen Bevolkerung 2010 Ein Beispiel ist die in der Beschreibenden Statistik haufig als Alterspyramide grafisch dargestellte Verteilung bei der eine Grundgesamtheit nach Geschlecht und Alter aufgeschlusselt wird Dabei kann es sich bei der Grundgesamtheit zum Beispiel um die deutsche Bevolkerung handeln Da bei einer solch umfangreichen Grundgesamtheit eine prazise Bestimmung der Verteilung von Alter und Geschlecht eine aufwandige Vollerhebung wie eine Volkszahlung voraussetzt sucht man nach Methoden mit denen weitgehend zuverlassige Aussagen bereits auf Basis von Teilerhebungen moglich sind Wie im Beispiel des Politbarometers werden dazu nur die Mitglieder einer zufallig ausgewahlten Teilmenge der Grundgesamtheit einer sogenannten Stichprobe in Bezug auf die interessierenden Merkmale untersucht Das mathematische Fundament das der Planung einer Stichprobenerhebung und der Interpretation der damit erzielten Stichprobenergebnisse zugrunde liegt bildet den Gegenstand der Mathematischen Statistik Ein wichtiges Ziel statistischer Methoden betrifft die Ergrundung kausaler Einflusse auch wenn mit statistischen Methoden allein niemals eine gerichtete Kausalbeziehung nachgewiesen werden kann Bei solchen Analysen sind zwei Ausgangssituationen zu unterscheiden Im ersten Fall werden die Mitglieder einer Stichprobe auf mehrere Eigenschaften hin untersucht etwa im Hinblick Korpergrosse und Gewicht oder den Krankheitszustand vor und nach einer zu untersuchenden Medikamentation Man spricht dann von einer verbundenen Stichprobe Ebenso moglich ist die Untersuchung von zwei oder mehr Stichproben aus jeweils verschiedenen Grundgesamtheiten zum Beispiel beim Vergleich der Einkommenshohen von Personen mit und ohne Hochschulabschluss Solche Fragestellungen heissen Zweistichprobenprobleme Methodik BearbeitenPrinzipielles Vorgehen der Mathematischen Statistik Bearbeiten Ware die Altersverteilung in der Grundgesamtheit bekannt konnten mit Formeln der Wahrscheinlichkeitstheorie Wahrscheinlichkeiten fur die innerhalb von Stichproben beobachtbaren Altersverteilungen berechnet werden die aufgrund der Zufallsauswahl der Stichproben zufalligen Schwankungen unterworfen sind In der mathematischen Statistik nutzt man solche Berechnungen um umgekehrt vom Stichprobenergebnis auf die Grundgesamtheit schlussfolgern zu konnen Dabei werden auf Basis der konkret fur eine Stichprobe beobachteten Merkmalswerte jene Haufigkeitsverteilungen innerhalb der Grundgesamtheit charakterisiert mit denen das gemachte Beobachtungsergebnis in plausibler Weise erklarbar wird Im Blickpunkt theoretischer Untersuchungen steht dabei nicht nur welche Schlussfolgerung mit einem gemachten Beobachtungsergebnis legitimiert werden kann sondern auch Abschatzungen daruber wie numerisch genau und wie sicher die Richtigkeit der Schlussfolgerung auch Inferenz genannt ist Man spricht daher auch von statistischer Inferenz Die einen Anwender interessierenden Haufigkeitsverteilungen sind nur indirekt Gegenstand der Methoden der mathematischen Statistik Stattdessen beziehen sich diese Methoden auf Zufallsvariablen Dabei werden insbesondere solche Zufallsvariablen betrachtet deren Wahrscheinlichkeitsverteilung den relativen Haufigkeiten der Merkmalswerte entspricht Speziell fur das angefuhrte Beispiel der Altersverteilung ist ein realisierter Wert der Zufallsvariablen gleich dem Alter eines zufallig ausgewahlten Deutschen Auf diese Weise konnen die einer Stichprobe ermittelten Beobachtungswerte als sogenannte Realisierungen unabhangig und identisch verteilter Zufallsvariablen aufgefasst werden Das Vorwissen wird in diesem Fall reprasentiert durch eine Familie von Wahrscheinlichkeitsverteilungen beziehungsweise durch eine entsprechende Familie von Wahrscheinlichkeitsmassen oder sie charakterisierende Parameter Man spricht von einer Verteilungsannahme Diese kann sowohl Aussagen uber mogliche Merkmalswerte etwa in Bezug auf deren Ganzzahligkeit als auch uber den Typ der Verteilung zum Beispiel die Werte sind normalverteilt beinhalten In dieser Interpretation liefert eine statistische Methode eine Aussage uber diejenigen Parameter der Verteilungsannahme die eine plausible Erklarung fur das gemachte Beobachtungsergebnis darstellen Werden im Rahmen der Untersuchung einer verbundenen Stichprobe mehrere numerische Merkmalswerte der Stichprobenmitglieder erhoben konnen diese durch eine Zufallsvariable mit vektoriellen Werten also mit Werten in einem n n dimensionalen reellen Vektorraum R n mathbb R n reprasentiert werden Auch in solchen Fallen lasst sich die Verteilungsannahme oft wie zum Beispiel im Fall einer mehrdimensionalen Normalverteilung durch wenige Parameter vollstandig charakterisieren Schatztheorie Bearbeiten Das zentrale Gebiet der mathematischen Statistik ist die Schatztheorie In ihr werden Schatzverfahren fur unbekannte Parameter der Grundgesamtheit entwickelt Mathematisch entsprechen solche Schatzformeln Funktionen deren Werte aus den Beobachtungsergebnissen der Stichprobe berechnet werden Man spricht daher allgemein von einer Stichprobenfunktion die im speziellen Fall einer bezweckten Parameterschatzung Schatzfunktion genannt wird Gegenstand der Schatztheorie ist es ausgehend von der Verteilungsannahme bestimmte Klassen von Schatzfunktionen zu untersuchen und hinsichtlich Plausibilitat Maximum Likelihood Methode oder verschiedener Qualitatskriterien wie Suffizienz oder Effizienz zu vergleichen Soll zum Beispiel die durchschnittliche Korpergrosse erwachsener Frauen in Deutschland mittels einer Stichprobe geschatzt werden ist die Annahme einer Normalverteilung mit den beiden unbekannten Parametern Erwartungswert und Varianz plausibel Auf dieser Grundlage konnen fur eine beliebige Schatzfunktion abhangig von den beiden unbekannten Parametern die moglichen Fehlerwerte samt der zugehorigen Wahrscheinlichkeiten auf ihre Eigenschaften hin untersucht werden Eine wichtige Eigenschaft ist dabei die Erwartungstreue der Schatzfunktion Sie ist erfullt wenn der Erwartungswert der Schatzfunktion gleich dem gesuchten Wert ist Fur das Beispiel des gesuchten Erwartungswertes liefert der Mittelwert der Stichprobenergebnisse eine erwartungstreue Schatzfunktion Ausser Schatzfunktionen in Form einer einwertigen Naherung eines gesuchten Parameters haben sich auch Bereichsschatzungen in Form eines sogenannten Konfidenzintervalls bewahrt Dabei liefert die Schatzfunktion mit hoher Wahrscheinlichkeit ein Intervall das den gesuchten aber unbekannten Parameter einschliesst Hypothesentest Bearbeiten Konkrete Vermutungen uber die Grundgesamtheit konnen durch geeignete statistische Tests uberpruft werden Dabei wird ausgehend von einer Hypothese auf Basis des Stichprobenergebnisses eine 0 1 Entscheidung uber die Verwerfung beziehungsweise Beibehaltung der Hypothese herbeigefuhrt Qualitatskriterien eines Hypothesentests sind niedrige Wahrscheinlichkeiten fur falsche Test Entscheidungen primar fur die Verwerfung einer in Wirklichkeit richtigen Hypothese Fehler 1 Art und in zweiter Linie fur die Nicht Verwerfung einer in Wirklichkeit falschen Hypothese Fehler 2 Art Eine zentrale Rolle beim Design eines Hypothesentests spielen sogenannte Prufgrossen auch Testgrossen oder Teststatistiken genannt Auch bei ihnen handelt es sich um Stichprobenfunktionen d h ihre Werte werden aus den innerhalb der Stichprobe ermittelten Beobachtungsergebnissen berechnet Die Interpretation der Prufgrossenwerte erfolgt mittels eines Verwerfungsbereichs der abhangig von der Vorgabe einer tolerierten Hochstwahrscheinlichkeit fur einen Fehler 1 Art Signifikanzniveau genannt gewahlt werden muss Dabei wird die Hypothese genau dann verworfen wenn der aus der Stichprobe berechnete Prufgrossenwert im Verwerfungsbereich liegt In bestimmten Situationen benotigen Hypothesentests keine Verteilungsannahme Moglich ist dies insbesondere in Fallen in denen nicht Parameter einer Verteilung sondern nur Range von Daten Gegenstand der Hypothese sind zum Beispiel wenn getestet werden soll ob der Median einer in der untersuchten Grundgesamtheit beobachtbaren Grosse einen bestimmten Wert uberschreitet Solche Hypothesentests und die ihnen zugrundeliegenden Modelle werden in der nichtparametrischen Statistik untersucht Methoden zur Kausalergrundung Bearbeiten Fur die Analyse von kausalen Einflussen zwischen den Merkmalswerten einer verbundenen Stichprobe gibt es verschiedene Modelle und darauf aufbauende Methoden wie die Regressionsanalyse und die Varianzanalyse Bei der Untersuchung verschiedener Stichproben ist die Prufung auf ubereinstimmende Verteilungen im Rahmen eines Homogenitatstests moglich Statistische Auswahlverfahren Bearbeiten Zur mathematischen Statistik gehoren auch die Theorien statistischer Auswahlverfahren sowie der optimalen Versuchs und Erhebungsplanung Bayessche Statistik Bearbeiten Eine Sonderrolle kommt der Bayesschen Statistik zu weil ihre Verfahren auf einer anderen Interpretation des mathematisch formalen Wahrscheinlichkeitsbegriffs beruhen Dabei werden Wahrscheinlichkeiten nicht frequentistisch sondern im Sinne der Sicherheit in der personlichen Einschatzung eines Sachverhaltes interpretiert siehe Bayesscher Wahrscheinlichkeitsbegriff Praktische Durchfuhrung von statistischen Methoden BearbeitenDie praktische Durchfuhrung eines statistischen Verfahrens ist ohne Hilfsmittel bei grossen Stichproben sehr aufwandig da aus den vielen Beobachtungsergebnissen zur Stichprobe der Wert einer Stichprobenfunktion namlich einer Prufgrosse zur Hypothesenprufung bzw einer Schatzfunktion zu berechnen ist Im Fall einer Hypothesenprufung ist ausserdem noch der Verwerfungsbereich anhand der Wahrscheinlichkeitsverteilung zur Prufgrosse festzulegen wozu fruher Quantiltabellen verwendet wurden Heute bieten Tabellenkalkulationsprogramme wie Excel fur beide Schritte vordefinierte Funktionen Ausserdem zum Einsatz kommen Statistikprogramme wie SPSS oder universelle Programmiersprachen wobei die Sprache R aufgrund ihrer kostenfrei erhaltlichen Entwicklungsumgebung zunehmend Verbreitung gefunden hat Mathematischer Formalismus und mathematische Grundlagen BearbeitenStatistisches Modell Bearbeiten Hauptartikel Statistisches Modell Eine ganzliche Formalisierung von statistischen Fragestellungen auf Basis mathematischer Objekte wird mit dem Begriff des statistischen Modells erzielt oft auch als statistischer Raum bezeichnet Abweichend vom bisher beschriebenen eher anwendungsorientierten Szenario kann dabei auf die Festlegung einer Grundgesamtheit verzichtet werden Die moglichen Stichprobenergebnisse x x werden zu einer Menge X mathcal X dem Stichprobenraum zusammengefasst Die darin beobachtbaren Ereignisse werden formal durch eine zum Stichprobenraum X mathcal X definierte s Algebra F mathcal F charakterisiert Die Verteilungsannahme das heisst die in Frage kommenden Wahrscheinlichkeitsverteilungen entsprechen einer Familie P ϑ ϑ 8 P vartheta vartheta in Theta von Wahrscheinlichkeitsmassen auf X F mathcal X mathcal F Ein statistisches Modell ist damit formal ein Tripel X F P ϑ ϑ 8 displaystyle mathcal X mathcal F P vartheta colon vartheta in Theta Ist ϑ vartheta ein reeller Parametervektor also 8 R d Theta subseteq mathbb R d so spricht man von einem parametrischen Modell mit Parameterraum 8 Theta Den Fall d 1 d 1 eines reellen Parameters nennt man einparametriges Modell Eine messbare Funktion S S von X F mathcal X mathcal F in einem weiteren Messraum S S mathcal S Sigma heisst Stichprobenfunktion oder Statistik Eine Schatzfunktion oder kurz ein Schatzer fur eine Kenngrosse t ϑ S tau vartheta in mathcal S des Parameters ist eine Stichprobenfunktion T X S displaystyle T colon mathcal X to mathcal S Mathematische Grundlagen Bearbeiten Die Grundlage der Mathematischen Statistik ist die Wahrscheinlichkeitsrechnung Allerdings wurden einige Inhalte und Begriffe der Wahrscheinlichkeitsrechnung historisch erst durch statistische Anwendungen motiviert Dazu gehoren insbesondere die sogenannten Testverteilungen d h die Wahrscheinlichkeitsverteilungen zu Prufgrossen bei Hypothesentests Neben den Wahrscheinlichkeitsverteilungen zu nicht parametrischen Tests zu nennen sind die Studentsche t Verteilung die Chi Quadrat Verteilung und die F Verteilung wobei die ersten beiden Verteilungen jeweils mit einer Anzahl von Freiheitsgraden und die F Verteilung durch zwei Anzahlen von Freiheitsgraden parametrisiert sind Geschichte der Mathematischen Statistik BearbeitenDie Denkweise und Argumentation der Mathematischen Statistik aber auch die Konstruktion und Untersuchung der fur statistische Methoden essentiellen Stichprobenfunktionen geht wesentlich auf britische Forscher zuruck Dazu gehoren insbesondere Karl Pearson der 1900 den Chi Quadrat Test beschrieb 1 William Sealy Gosset der 1908 unter dem Pseudonym Student sein Konzept des t Tests publizierte 2 und Ronald Aylmer Fisher der 1922 eine umfassende Systematisierung statistischer Methoden und Argumentationsweisen veroffentlichte 3 Literatur BearbeitenJorg Bewersdorff Statistik wie und warum sie funktioniert Ein mathematisches Lesebuch mit einer Einfuhrung in R 2 Auflage Springer Spektrum 2021 ISBN 978 3 662 63711 1 doi 10 1007 978 3 662 63712 8 Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 5 Auflage de Gruyter 2015 ISBN 978 3 11 035969 5 doi 10 1515 9783110359701 Norbert Henze Stochastik fur Einsteiger Eine Einfuhrung in die faszinierende Welt des Zufalls 13 Auflage Springer Spektrum 2021 ISBN 978 3 662 63839 2 doi 10 1007 978 3 662 63840 8 Hermann Witting Mathematische Statistik Band 1 Parametrische Verfahren bei festem Stichprobenumfang Teubner Verlag 1985 ISBN 3 519 02026 2 doi 10 1007 978 3 322 90150 7 Herrmann Witting Ulrich Muller Funk Mathematische Statistik Band 2 Asymptotische Statistik Parametrische Modelle und nichtparametrische Funktionale Teubner Verlag 1995 ISBN 3 322 90153 X doi 10 1007 978 3 322 90152 1 Dieter Rasch und Dieter Schott Mathematische Statistik Fur Mathematiker Natur und Ingenieurwissenschaftler 1 Auflage November 2015 648 Seiten Hardcover 150 Abbildungen Lehrbuch ISBN 978 3 527 33884 9 Wiley VCH WeinheimEinzelnachweise Bearbeiten Karl Pearson On the criterion that a given system of derivations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling In The London Edinburgh and Dublin Philosophical Magazine and Journal of Science Band 50 Nr 5 1900 S 157 175 doi 10 1080 14786440009463897 Student The Probable Error of a Mean In Biometrika Band 6 Nr 1 1908 S 1 25 doi 10 2307 2331554 R A Fisher On the mathematical foundations of theoretical statistics In Philosophical Transactions of the Royal Society A 222 1922 S 309 368 doi 10 1098 rsta 1922 0009 Weblinks BearbeitenLiteratur uber Inferenzstatistik im Katalog der Deutschen NationalbibliothekNormdaten Sachbegriff GND 4247120 5 lobid OGND AKS Anmerkung Ansetzungsform GND Inferenzstatistik Abgerufen von https de wikipedia org w index php title Mathematische Statistik amp oldid 226486218