www.wikidata.de-de.nina.az
Die Falscherkennungsrate englisch False Discovery Rate kurz FDR findet Anwendung bei der Bewaltigung multipler Testprobleme Die FDR ist ein Gutekriterium welches die Richtigkeit aller akzeptierten Hypothesen misst und als Zielgrosse eine Abwagung zwischen moglichst wenig falschen Entdeckungen aber dennoch moglichst vielen richtigen Treffern ermoglicht Dieser Artikel wurde auf der Qualitatssicherungsseite des Portals Mathematik eingetragen Dies geschieht um die Qualitat der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen Bitte hilf mit die Mangel dieses Artikels zu beseitigen und beteilige dich bitte an der Diskussion Artikel eintragen Dieser Artikel oder Abschnitt bedarf einer grundsatzlichen Uberarbeitung Naheres sollte auf der biggerj1 Diskussion 14 22 6 Jan 2023 CET angegeben sein Bitte hilf mit ihn zu verbessern und entferne anschliessend diese Markierung Der Begriff wurde erstmals 1995 von Yoav Benjamini und Yosi Hochberg definiert 1 Inhaltsverzeichnis 1 Hintergrund 2 Definition 3 Benjamini Hochberg Prozedur 4 Storey Tibshirani Prozedur 5 Siehe auch 6 Weblinks 7 EinzelnachweiseHintergrund BearbeitenGrundsatzlich ist festzuhalten dass die Prufung mehrerer Hypothesen mit einer erhohten Wahrscheinlichkeit fur die Kumulierung von Alphafehler Fehler 1 Art einhergeht Dies bedeutet dass trotz der tatsachlichen Richtigkeit einer Nullhypothese bei multiplen Tests gelegentlich falschlicherweise eine Ablehnung erfolgt was als Falsch Alarm bezeichnet wird Infolgedessen erfordert die Signifikanzprufung bei mehreren Tests ein strengeres und somit niedrigeres Signifikanzniveau im Vergleich zu einem einzelnen Hypothesentest Um dieser Problematik zu begegnen wird haufig die Bonferroni Korrektur angewandt Diese konservative Methode verwendet fur samtliche Hypothesen ein einheitlich niedriges Signifikanzniveau was die Wahrscheinlichkeit eines Falsch Alarms verringert Dennoch ist zu berucksichtigen dass diese Korrektur so konservativ ist dass auch die Ablehnung der Nullhypothese erschwert wird was potenziell die Entdeckung signifikanter Ergebnisse beeintrachtigen kann Eine alternative Vorgehensweise bietet die Benjamini Hochberg Prozedur Diese Methode kontrolliert die Prazision anstatt des Erinnerns der Nullhypothese im Gegensatz zur Bonferroni Korrektur Dadurch erzielt sie eine hohere statistische Power im Vergleich zur Bonferroni Korrektur Definition BearbeitenDie Falscherkennungsrate eines Testverfahrens wird als das erwartete Verhaltnis der falschlicherweise abgelehnten Nullhypothesen zu den insgesamt abgelehnten Nullhypothesen definiert Mit anderen Worten wird die FDR als der Anteil der falsch positiven Erkennungen ausgedruckt Q F D R E F P F P T P 1 Precision displaystyle Q FDR E left frac FP FP TP right 1 text Precision nbsp wobei E displaystyle E nbsp der Erwartungswert ist F P displaystyle FP nbsp die Zahl der falsch positiven Erkennungen und T P displaystyle TP nbsp die Zahl der richtig positiven Erkennungen Benjamini Hochberg Prozedur BearbeitenDie Benjamini Hochberg Prozedur BH Prozedur ist ein Verfahren das bei der multiplen Testung von Nullhypothesen angewandt wird um die Falscherkennungsrate FDR auf einem akzeptablen Niveau zu halten Die FDR reprasentiert das Verhaltnis der Anzahl der falschlicherweise abgelehnten Nullhypothesen zur Gesamtzahl der abgelehnten Nullhypothesen Die BH Prozedur beginnt mit der Sortierung der p Werte Signifikanzniveaus in aufsteigender Reihenfolge Sei 𝑝𝑖 der 𝑖 te p Wert und 𝑚 die Gesamtzahl der getesteten Hypothesen Dann wird die Prozedur wie folgt durchgefuhrt Die p Werte werden sortiert 𝑝 1 𝑝 2 𝑝 𝑚 Ein kritischer Schwellenwert 𝑞 wird berechnet um die FDR zu kontrollieren Dieser Schwellenwert ist definiert als 𝑞 𝑘 𝑚𝑄 wobei 𝑘 die aktuelle Position in der sortierten Liste der p Werte ist und 𝑄 die gewunschte maximale FDR ist Die BH Prozedur lehnt die Nullhypothesen ab fur die gilt 𝑝𝑖 𝑞 Indem die FDR Bedingung 𝑝𝑖 gt 𝑖 𝑚𝑄 fur abgelehnte Hypothesen erfullt wird stellt die BH Prozedur sicher dass das Verhaltnis von falsch positiven Erkennungen zu den insgesamt abgelehnten Nullhypothesen unter der Schranke 𝑄 bleibt Mit anderen Worten wird nur eine begrenzte Anzahl von Hypothesen abgelehnt um eine akzeptable FDR zu gewahrleisten Die Benjamini Hochberg Prozedur bietet somit eine Methode um das Dilemma der multiplen Testung zu bewaltigen bei dem die Wahrscheinlichkeit von falsch positiven Ergebnissen steigt Durch die Anpassung der Schwellenwerte fur die p Werte basierend auf der Gesamtanzahl der getesteten Hypothesen und der gewunschten FDR ermoglicht die BH Prozedur eine bessere Kontrolle uber die Rate der falsch positiven Erkennungen und tragt dazu bei verlassliche statistische Schlussfolgerungen aus komplexen Datensatzen zu ziehen nbsp Die Benjamini Hochberg Prozedur wurde auf eine Menge von aufsteigend angeordneten p Werten angewendet wobei m 20 und das Kontrollniveau der Falscherkennungsrate FDR Q 0 05 ist Die p Werte die zu den abgelehnten Nullhypothesen gehoren sind rot markiert Die blaue Linie ist durch y mQk beschrieben wobei k die auf der x Achse aufgetragenen Indizes der Sortierung sind Storey Tibshirani Prozedur Bearbeiten nbsp Schematische Darstellung der Storey Tibshirani Prozedur zur Korrektur fur multiples Testen Das Histogramm zeigt die Verteilung der p Werte beim multiplen Testen Die y Achse reprasentiert die Haufigkeit der p Werte Der Grenzwert fur die p Werte wird so gewahlt dass die Falscherkennungsrate FDR erfullt ist Die Storey Tibshirani Prozedur ist ein weiteres leistungsfahiges Verfahren zur Kontrolle der Falscherkennungsrate FDR bei multiplen Testungen Sie ermoglicht eine prazisere Steuerung der FDR indem sie q Werte verwendet die eine analoge Rolle wie p Werte spielen aber speziell auf die FDR Steuerung abgestimmt sind Die Prozedur ist nach John D Storey und Robert Tibshirani benannt die sie in einer wegweisenden Veroffentlichung im Jahr 2003 eingefuhrt haben Die Storey Tibshirani Prozedur stellt eine Weiterentwicklung der Benjamini Hochberg Prozedur dar und bietet eine zusatzliche Dimension der Kontrolle uber die FDR Die Prozedur beruht auf der Annahme dass die Verteilung der p Werte unter der Nullhypothese gleichmassig ist wahrend sie unter der Alternativhypothese eine Uberlagerung von Null und Nicht Null Verteilungen aufweist Die q Werte werden verwendet um die FDR fur eine gegebene Menge von abgelehnten Nullhypothesen zu berechnen Die Berechnung der q Werte erfolgt in mehreren Schritten Die p Werte werden sortiert 𝑝 1 𝑝 2 𝑝 𝑚 Die Prozedur berechnet den empirischen Anteil der tatsachlichen Nullhypothesen unter den abgelehnten Hypothesen auch bekannt als p0 Dieser Wert ist ein wichtiger Parameter fur die Berechnung der q Werte Die q Werte werden berechnet indem die p Werte mit der p0 geschatzt und an die Anzahl der abgelehnten Hypothesen angepasst werden Die Formel zur Berechnung des q Werts lautet 𝑞 𝑖 𝑝 𝑖 𝑚 𝑖 p0 Indem die q Werte basierend auf der geschatzten p0 und der Anzahl der abgelehnten Hypothesen berechnet werden ermoglicht die Storey Tibshirani Prozedur eine genauere Steuerung der FDR im Vergleich zur reinen Verwendung von p Werten Sie bietet eine flexiblere Methode um die Anzahl der falsch positiven Erkennungen in einem multiplen Testverfahren zu regulieren und so die statistische Zuverlassigkeit der Ergebnisse zu verbessern Die Verwendung von q Werten in der Storey Tibshirani Prozedur unterstreicht die fortschreitende Entwicklung statistischer Methoden zur Bewaltigung der Herausforderungen bei der Analyse grosser Datensatze Durch die prazise Kontrolle der Falscherkennungsrate stellt diese Prozedur eine wertvolle Erganzung zu den Werkzeugen dar die Forscher zur Verfugung haben um belastbare Schlussfolgerungen aus komplexen Daten zu ziehen Siehe auch BearbeitenBeurteilung eines binaren KlassifikatorsWeblinks BearbeitenFalse Discovery RateEinzelnachweise Bearbeiten Benjamini Yoav Hochberg Yosef Controlling the false discovery rate a practical and powerful approach to multiple testing In Journal of the Royal Statistical Society Series B Nr 57 1995 S 289 300 Abgerufen von https de wikipedia org w index php title Falscherkennungsrate amp oldid 236342702