www.wikidata.de-de.nina.az
Die Biostatistik ist ein Bereich der Statistik Sie beschaftigt sich mit Fragestellungen die sich in der biologischen und medizinischen Forschung deshalb auch als Medizinische Statistik bezeichnet und anderen sich mit Lebewesen befassenden Forschungsbereichen z B im landwirtschaftlichen Versuchswesen der statistischen Genetik ergeben Zu ihren Aufgaben zahlen unter anderem die Planung und Durchfuhrung von Studien sowie die Analyse gewonnener Daten das heisst die Auswertung zahlenmassiger Beobachtungen mit Hilfe statistischer Methoden Oft wird der Begriff Biometrie auch synonym zu Biostatistik verwendet Inhaltsverzeichnis 1 Moderne Biostatistik 2 Klinische Studien 3 Ernahrungsforschung 4 Praventivmedizin 5 Literatur 6 Weblinks 7 EinzelnachweiseModerne Biostatistik BearbeitenIn letzter Zeit betrachtet man eine Zunahme der Bedeutung der Statistik in den Lebenswissenschaften Dies ist bedingt durch das Vorhandensein und Aufkommen verschiedener Hochdurchsatzmethoden wie Next Generation Sequencing Microarrays auf DNA und RNA Ebene sowie Massenspektrometrie auf der Proteinebene Die genannten technischen Modalitaten generieren enorme Rohdatenmengen die nur mit biostatistischen Methoden analysiert werden konnen Diesen neuen Ansatz bezeichnet man auch als Systembiologie Die verwendeten Verfahren zur Auswertung dieser Daten sind durchaus komplex Auf methodischer Seite kommen unter anderem zum Einsatz Statistisches maschinelles Lernen durch z B Kunstliche neuronale Netze Support Vector Machines und Hauptkomponentenanalyse Naturlich spielen auch klassische Konzepte der Statistik wie die Regression oder die Korrelation als Grundlage dieser Verfahren eine Rolle Zur Auswertung dieser Daten ist robuste Statistik notig Hierunter versteht man statistische Methoden die nicht anfallig gegenuber Ausreissern das sind Messwerte die aufgrund zufalliger Erscheinungen viel zu hoch oder zu niedrig sind sind In Genexpressionsdaten kommen sehr viele Ausreisser vor Hierzu muss man sich nur vergegenwartigen dass schon ein Staubpartikel auf einem Microarray gravierende Auswirkung auf die Messungen haben kann Auch die Random Forest Methode Zufallswald Methode von Leo Breiman 1 ist immer bedeutender insbesondere weil hier im Gegensatz zu zum Beispiel den Support Vector Machines eine sehr gute Interpretierbarkeit gegeben ist Es ist namlich so dass bei dieser Methode zufallige Entscheidungsbaume erzeugt werden und diese konnen klar interpretiert werden So kann man zum Beispiel klinische Entscheidungen statistisch absichern und unterstutzen Ferner kann man mit mathematischer Strenge die Korrektheit klinischer Entscheidungen beweisen Die Methode kommt auch in klinischen Entscheidungsunterstutzungssystemen zum Einsatz Ein weiterer Vorteil neben der Interpretierbarkeit der Random Forests im Gegensatz zu den SVMs ist die Rechengeschwindigkeit Die Trainingszeit bei einem Random Forest steigt linear mit der Anzahl der Baume Die Evaluierung eines Testbeispieles geschieht auf jedem Baum einzeln und ist daher parallelisierbar Grundsatzlich ist zu sagen dass die enorm grossen biologischen Datensatze hochdimensional und redundant sind Dies bedeutet dass viele der gesammelten Informationen gar nicht relevant fur die Klassifikation von zum Beispiel kranken und nichtkranken Individuen sind Auch kann es sein dass durch Vorliegen von Multikollinearitat die Information eines Pradiktors in einem anderen Pradiktor enthalten ist Die beiden Pradiktoren konnen eine hohe Korrelation aufweisen Hier wendet man um den Datensatz zu verkleinern ohne wesentliche Information zu verlieren sog Dimensionsreduktionstechniken zum Beispiel die oben genannte Hauptkomponentenanalyse an Klassische statistische Methoden wie die lineare oder logistische Regression und die lineare Diskriminanzanalyse sind haufig nicht geeignet fur ihre Anwendung auf hochdimensionale Daten also Daten bei welchen die Anzahl der Beobachtungen n displaystyle n nbsp kleiner als die Anzahl der Pradiktoren k displaystyle k nbsp ist n lt k displaystyle n lt k nbsp Diese statistischen Methoden wurden fur niedrig dimensionale Daten n gt k displaystyle n gt k nbsp entwickelt Haufig kann es sogar so sein dass die Anwendung einer linearen Regression auf einen hochdimensionalen Datensatz mit allen Pradiktoren ein sehr hohes Bestimmtheitsmass R 2 displaystyle R 2 nbsp liefert obwohl es sich nicht um ein statistisches Modell mit grosser Vorhersagekraft handelt Bei der Interpretation ist hier Vorsicht geboten In letzter Zeit ist ferner versucht worden das Wissen um genregulatorische Netzwerke und biochemische Signalkaskaden mit in die Analyse einfliessen zu lassen Gene Set Enrichment Analyse Hierzu existieren mehrere bioinformatische Tools u a GSEA Gene Set Enrichment Analysis vom Broad Institute 2 Die Uberlegung ist dass es haufig sinnvoller ist die Perturbation ganzer Genmengen z B Signalkaskaden wie der Jak Stat Signalweg zusammen zu betrachten als die Perturbation einzelner Gene zu untersuchen Ferner macht man sich so die Forschungsarbeiten uber biologische Signalkaskaden zu Nutze Die Analyse wird so auch robuster Denn es ist wahrscheinlicher ein einzelnes falsch positives Gen zu finden als eine ganze falsch positive Signalkaskade Ferner besteht die Moglichkeit dass die Perturbation einer gefundenen Signalkaskade bereits in der Literatur beschrieben ist Die Mendelsche Randomisierung ist ein nicht experimenteller Ansatz zur Bestimmung kausaler Zusammenhange unter Verwendung von DNA Sequenzen 3 Klinische Studien BearbeitenDie Biostatistik kommt auch in klinischen Studien zum Einsatz In solchen Studien wird im Rahmen der evidenzbasierten Medizin die Wirksamkeit bestimmter Medikamente Medizinprodukte oder Behandlungsverfahren untersucht Die Biostatistik hilft bereits bei der optimalen Studienplanung also ganz am Anfang einer klinischen Studie So muss zum Beispiel die Versuchszahl berechnet werden Auch ist die Studie im Idealfall doppelblind d h sowohl Experimentator als auch Patient wissen nicht ob sie Placebo oder Medikament enthalten Mit Hilfe moderner statistischer Verfahren kann ermittelt werden welcher Patient besonders von welcher Therapie profitieren wird bzw ob eine Therapie uberhaupt sinnvoll ist Mithilfe der Technik des statistischen Matchings kann aus nicht randomisierten Observationsdaten eine quasi randomisierte Studie entwickelt werden Ernahrungsforschung BearbeitenBiostatistische Methoden kommen auch in der Ernahrungsforschung zum Einsatz um die gesundheitliche Wirksamkeit bestimmter Nahrungsmittel erforschen zu konnen Hierbei spielen Fragestellungen wie Steht ein bestimmtes Nahrungsmittel mit der Entstehung einer bestimmten Krankheit in Verbindung oder Wirkt sich der Konsum eines bestimmten Nahrungsmittels positiv auf eine bestimmte Krankheit aus eine Rolle In Deutschland forscht u a das Deutsche Institut fur Ernahrungsforschung auf diesem Gebiet Praventivmedizin BearbeitenDie Praventivmedizin ist ein Teilgebiet der Medizin welches sich mit der Verhinderung von Krankheiten befasst bevor diese uberhaupt entstehen Auch hier kommt die Biostatistik zum Einsatz um herauszufinden wie Krankheiten verhindert werden konnen Literatur BearbeitenAugust Putter Die Auswertung zahlenmassiger Beobachtungen in der Biologie Eine praktische Anleitung in Beispielen Walter de Gruyter amp Co Berlin 1929 Wolfgang Kohler Gabriel Schachtel Peter Voleske Biostatistik Eine Einfuhrung fur Biologen und Agrarwissenschaftler 3 aktualisierte u erw Aufl Springer Berlin 2002 ISBN 978 3 540 42947 0 Christel Weiss Basiswissen Medizinische Statistik 7 Aufl Springer Berlin 2019 ISBN 978 3 662 56587 2 Jurgen Hedderich Lothar Sachs Angewandte Statistik Mentodensammlung mit R 16 Aufl Springer Berlin 2018 ISBN 978 3 662 56656 5 4 Weblinks BearbeitenDeutsche Region der Internationalen Biometrischen Gesellschaft IBS DR Region Osterreich Schweiz ROeS der IBSEinzelnachweise Bearbeiten Leo Breiman Random Forests In Machine Learning 45 S 5 doi 10 1023 A 1010933404324 A Subramanian P Tamayo V K Mootha S Mukherjee B L Ebert M A Gillette A Paulovich S L Pomeroy T R Golub E S Lander J P Mesirov Gene set enrichment analysis a knowledge based approach for interpreting genome wide expression profiles In Proceedings of the National Academy of Sciences Band 102 Nummer 43 Oktober 2005 S 15545 15550 doi 10 1073 pnas 0506580102 PMID 16199517 PMC 1239896 freier Volltext George Davey Smith Mendelian Randomization for Strengthening Causal Inference in Observational Studies In Perspectives on Psychological Science 5 2010 S 527 doi 10 1177 1745691610383505 Google Books Vorschau Abgerufen am 16 Februar 2022 Normdaten Sachbegriff GND 4729990 3 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Biostatistik amp oldid 239493344