www.wikidata.de-de.nina.az
Die Ereigniszeitanalyse auch Verweildaueranalyse Verlaufsdatenanalyse Ereignisdatenanalyse englisch survival analysis analysis of failure times und event history analysis ist ein Instrumentarium statistischer Methoden bei der die Zeit bis zu einem bestimmten Ereignis time to event zwischen Gruppen verglichen wird um die Wirkung von prognostischen Faktoren medizinischer Behandlung oder schadlichen Einflussen zu schatzen Das Ereignis kann dabei ein bevorstehender Tod sein jedoch auch beliebige andere Endpunkte wie Heilung Erkrankung oder Eintreten einer Komplikation kommen infrage Beispiele fur eine solche Analyse sind der Kaplan Meier Schatzer die Cox Regression oder das Modell fur beschleunigte Ausfallzeiten Eine zentrale Grosse ist die Hazardrate Dieser Artikel wurde auf der Qualitatssicherungsseite des Portals Mathematik eingetragen Dies geschieht um die Qualitat der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen Bitte hilf mit die Mangel dieses Artikels zu beseitigen und beteilige dich bitte an der Diskussion Artikel eintragen Darstellung zweier Uberlebensfunktionen Kaplan Meier Schatzer fur zwei unterschiedliche Patientengruppen Inhaltsverzeichnis 1 Bezeichnungen fur dieses Verfahren 2 Anwendungsbereiche 3 Grundlegende Grossen und Konzepte 3 1 Uberlebensfunktion 3 2 Ereigniszeit Verteilungsfunktion und Ereignisdichtefunktion 3 3 Hazardfunktion und kumulierte Hazardfunktion 3 4 Aus der Uberlebensfunktion abgeleitete Grossen 3 5 Zusammenhang 4 Beispiele fur Uberlebensfunktionen 5 Schatzen der Parameter 6 Anwendungen 7 Gute 8 Siehe auch 9 Literatur 10 Weblinks 11 EinzelnachweiseBezeichnungen fur dieses Verfahren BearbeitenDas Verfahren wurde von unterschiedlichen Autoren abweichend bezeichnet Weil es verschiedene Anwendungszwecke gibt sind heute noch verschiedene Begriffe in Gebrauch die gleichwertig sind und oft synonym verwendet werden Das Grundverfahren ist immer gleich In der medizinischen Statistik meist Uberlebensanalyse Uberlebenszeitanalyse In der empirischen Sozialforschung ist die Methode als Verweildaueranalyse auch Verlaufsdatenanalyse Ereignisanalyse bekannt wo sie sich mit Veranderungen in einem sozialen Zustand z B Dauer der Ehe beschaftigt Sie liefert damit prazisere Beschreibungen von Verlaufsdaten als z B eine Zeitreihen oder Paneldatenanalyse Sie informiert anhand von ereignisorientierten Datenstrukturen uber die genauen Zeitdauern bis zu einem Zustandswechsel In den Ingenieurwissenschaften wird das Verfahren auch Zuverlassigkeitsanalyse genannt englisch Reliability Theory In englischsprachigen Programmpaketen wird sie als Survival Analysis Analysis of Failure Times oder auch Event History Analysis bezeichnet Anwendungsbereiche BearbeitenDieses Verfahren kann immer eingesetzt werden wenn eine Mortalitat vorliegt d h ein sukzessives Ausscheiden von Messobjekten aus der statistischen Erfassung Es muss sich dabei nicht um den Tod handeln sondern auch um den Ausfall mechanischer Systeme oder Eintritt in den Ruhestand Auch beim Eintreten positiver Ereignisse d h neuer Ereignisse fur die es bisher keine Messgrundlage gab kann das Verfahren angewendet werden Geburt des ersten Kindes Auftreten erster technischer Probleme oder Garantiefalle Beispiele fur eine Ereigniszeitanalyse Welcher Anteil einer Population wird nach einer gegebenen Zeit noch leben Mit welcher Rate werden die Uberlebenden dann sterben Welche Eigenschaften oder Einflusse erhohen oder verringern die Uberlebenswahrscheinlichkeit Zuerst ist es notwendig Ereigniszeit Lebenszeit zu definieren Fur biologische Systeme endet die Lebenszeit mit dem Tod Schwieriger ist es mit der mechanischen Zuverlassigkeit Ausfalle sind oft nicht klar definiert und konnen partiell sein Oft ist es nur graduelles Versagen das sich nicht so leicht zeitlich festlegen lasst Ahnliche Schwierigkeiten treten bei anderen biologischen Ereignissen auf Beispielsweise sind ein Herzanfall oder ein Organversagen schwierig zeitlich festzulegen Ublicherweise werden nur Ereignisse untersucht die hochstens einmal pro Subjekt auftreten konnen Eine Erweiterung auf wiederholt auftretende Ereignisse ist moglich Grundlegende Grossen und Konzepte BearbeitenUberlebensfunktion Bearbeiten Hauptartikel Uberlebensfunktion Die zentrale Funktion ist die Uberlebensfunktion englisch Survival Function Survivor Function und wird mit S displaystyle S nbsp bezeichnet Im Bereich technischer Systeme wird fur diese Funktion die Bezeichnung Zuverlassigkeitsfunktion englisch Reliability Function verwendet und mit R t displaystyle R t nbsp bezeichnet S t R t P T gt t displaystyle S t R t P T gt t nbsp dabei bezeichnet t displaystyle t nbsp bestimmte Zeitpunkte T displaystyle T nbsp reprasentiert die Lebenszeit die Zeit bis zum Tod bzw zum Ausfall eines Gerats und P displaystyle P nbsp bezeichnet die Wahrscheinlichkeit Die Uberlebensfunktion gibt die Wahrscheinlichkeit an mit der ein Individuum der Population eine Lebenszeit T displaystyle T nbsp langer bzw grosser als t displaystyle t nbsp haben wird 1 Da zu Beginn einer Analyse t 0 displaystyle t 0 nbsp alle interessierenden Individuen noch leben ist die Wahrscheinlichkeit diesen nullten Zeitpunkt zu uberleben gleich S 0 1 displaystyle S 0 1 nbsp Falls ein sofortiger Tod oder Ausfall moglich ist dann kann dieser Startwert auch kleiner als 1 displaystyle 1 nbsp sein Die Uberlebensfunktion muss monoton fallend sein S u S t displaystyle S u leq S t nbsp falls u gt t displaystyle u gt t nbsp Ist diese Funktion bekannt dann sind auch die Verteilungsfunktion F displaystyle F nbsp und die Dichtefunktion f displaystyle f nbsp eindeutig definiert Ublicherweise geht man davon aus dass mit zunehmender Zeit die Wahrscheinlichkeit den jeweiligen Zeitpunkt zu uberleben gegen Null geht d h lim t S t 0 displaystyle lim t to infty S t 0 nbsp Ein Grenzwert grosser als Null wurde ewiges Leben implizieren Anders ausgedruckt sind t displaystyle t nbsp und S t displaystyle S t nbsp gegenlaufig Je mehr Zeit vergeht desto wahrscheinlicher wird das Eintreten eines bestimmten Ereignisses Die Uberlebensfunktion S t displaystyle S t nbsp beginnt als Funktion bei t 0 displaystyle t 0 nbsp mit dem Wert 1 displaystyle 1 nbsp und strebt mit der Zeit zum Wert 0 displaystyle 0 nbsp wobei 0 displaystyle 0 nbsp meistens nicht erreicht wird da die Betrachtung zu einem bestimmten Zeitpunkt beendet wird Grafisch kann man sich S t displaystyle S t nbsp als von 1 displaystyle 1 nbsp aus in Richtung 0 displaystyle 0 nbsp abwarts fuhrende Treppenfunktion vorstellen also monoton fallend wobei die einzelnen Stufen unterschiedlich steil bzw breit sein konnen Die Steilheit der Treppenstufen ergibt sich aus der Anzahl der sterbenden Individuen und ihre Breite durch die Anzahl der vergangenen Zeitpunkte t displaystyle t nbsp Je breiter und flacher solche Treppenstufen sind desto hoher ist die Uberlebenswahrscheinlichkeit der Individuen 2 Ereigniszeit Verteilungsfunktion und Ereignisdichtefunktion Bearbeiten Aus der Uberlebensfunktion lassen sich verwandte Grossen ableiten Die Ereigniszeit Verteilungsfunktion in technischen Bezug auch als Ausfallswahrscheinlichkeit englisch Probability of failure bezeichnet und mit F abgekurzt ist die komplementare Funktion zur Uberlebensfunktion F t P T t 1 S t displaystyle F t P T leq t 1 S t nbsp und daher gilt auch S t 1 F t displaystyle S t 1 F t nbsp Die erste Ableitung von F displaystyle F nbsp die Ereignisdichtefunktion oder Ausfallsdichte englisch failure density function wird mit f displaystyle f nbsp bezeichnet f t d F t d t displaystyle f t frac mathrm d F t mathrm d t nbsp Die Ereignisdichtefunktion ist die Rate des betrachteten Ereignisses pro Zeitspanne Hazardfunktion und kumulierte Hazardfunktion Bearbeiten Die Ausfallrate speziell in der Uberlebenszeitanalyse auch Hazardrate oder Hazardfunktion genannt und mit h t displaystyle h t nbsp bezeichnet ist definiert als Rate mit der ein Ereignis zum Zeitpunkt T displaystyle T nbsp eintritt unter der Voraussetzung dass es bis zum Zeitpunkt t noch nicht eingetreten ist h t d t P t lt T lt t d t T gt t f t d t S t S t d t S t displaystyle h t mathrm d t P t lt T lt t mathrm d t mid T gt t frac f t mathrm d t S t frac S t mathrm d t S t nbsp englisch force of mortality ist ein Synonym fur die Hazardfunktion welches speziell in der Demografie verwendet wird Die Ausfallrate muss stets positiv sein h t gt 0 displaystyle h t gt 0 nbsp und das Integral uber 0 displaystyle 0 infty nbsp muss unendlich sein Die Hazardfunktion kann anwachsen oder fallen sie braucht weder monoton noch stetig zu sein Alternativ kann die Hazardfunktion auch durch die kumulative Hazardfunktion H displaystyle H nbsp ersetzt werden H t ln S t displaystyle H t ln S t nbsp damit ist d d t H t S t S t h t displaystyle frac rm d rm d t H t frac S t S t h t nbsp H displaystyle H nbsp heisst kumulative Hazardfunktion da H t 0 t h s d s displaystyle H t int 0 t h s mathrm d s nbsp gilt Sie beschreibt die Ansammlung von Hazard Risiko im Laufe der Zeit Aus H t ln S t displaystyle H t ln S t nbsp folgt dass H t displaystyle H t nbsp mit wachsender Zeit t displaystyle t nbsp unbegrenzt wachst falls S t displaystyle S t nbsp gegen Null geht Weiter folgt dass h t displaystyle h t nbsp nicht zu stark fallen darf weil sonst die kumulierte Hazardfunktion gegen einen endlichen Wert konvergiert Beispielsweise ist e t displaystyle e t nbsp keine Hazardfunktion irgendeiner Ereigniszeitverteilung da das Integral konvergiert Aus der Uberlebensfunktion abgeleitete Grossen Bearbeiten Die verbleibende Lebenszeit zu einem Zeitpunkt t0 ist die bis zum Tod bzw Ausfall verbleibende Zeit also T t 0 displaystyle T t 0 nbsp Die zukunftige Lebenserwartung ist der Erwartungswert der verbleibenden Lebenszeit Die Ereignisdichtefunktion fur den Zeitpunkt t t 0 displaystyle t t 0 nbsp unter der Voraussetzung des Uberlebens bis t 0 displaystyle t 0 nbsp ist gerade f t t 0 S t 0 displaystyle frac f t t 0 S t 0 nbsp Damit ist die zukunftige Lebenserwartung 1 S t 0 0 t f t t 0 d t displaystyle frac 1 S t 0 int 0 infty t f t t 0 mathrm d t nbsp oder1 S t 0 t 0 S t d t displaystyle frac 1 S t 0 int t 0 infty S t mathrm d t nbsp Fur t 0 0 displaystyle t 0 0 nbsp reduziert sich dies auf die Lebenserwartung bei der Geburt In Zuverlassigkeitsanalysen wird die Lebenserwartung Mean Time To Failure und die mittlere Restlebenszeit genannt Das Alter in dem der Anteil der Uberlebenden einen vorgegebenen Wert q erreicht kann man uber die Gleichung S t q ermitteln t ist das gesuchte Quantil Meist ist man an Grossen wie dem Median der Lebensdauer q 1 2 oder anderen Quantilen wie q 0 90 oder q 0 99 interessiert Zusammenhang Bearbeiten In folgender Darstellung ist tabellarisch der mathematische Zusammenhang zwischen den verschiedenen Kenngrossen dargestellt AusfallwahrscheinlichkeitF t UberlebenswahrscheinlichkeitS t Ausfalldichtef t Ausfallrateh t F t 1 S t displaystyle 1 S t nbsp 0 t f t d t displaystyle int limits 0 t f tau mathrm d tau nbsp 1 e 0 t h t d t displaystyle 1 e int limits 0 t h tau d tau nbsp S t 1 F t displaystyle 1 F t nbsp t f t d t displaystyle int limits t infty f tau mathrm d tau nbsp e 0 t h t d t displaystyle e int limits 0 t h tau mathrm d tau nbsp f t d F t d t displaystyle frac mathrm d F t mathrm d t nbsp d S t d t displaystyle frac mathrm d S t mathrm d t nbsp h t e 0 t h t d t displaystyle h t cdot e int limits 0 t h tau mathrm d tau nbsp h t 1 1 F t d F t d t displaystyle frac 1 1 F t cdot frac mathrm d F t mathrm d t nbsp 1 S t d S t d t displaystyle frac 1 S t cdot frac mathrm d S t mathrm d t nbsp f t t f t d t displaystyle frac f t int limits t infty f tau d tau nbsp Beispiele fur Uberlebensfunktionen BearbeitenFur Ereigniszeitmodelle wahlt man zuerst eine grundlegende Uberlebensfunktion aus Es ist relativ einfach eine Verteilungsfunktion durch eine andere zu ersetzen um die Auswirkungen zu studieren An der grundlegenden Theorie andert sich nichts Bei der Wahl der konkreten Verteilung spielen Vorkenntnisse uber den konkreten Prozess eine grosse Rolle Es ist in etwa analog zur Auswahl der Kopplungsfunktion in verallgemeinerten linearen Modellen Einige haufig verwendete Funktionen sind im Folgenden aufgelistet Wahrscheinlichkeitsverteilung Uberlebensfunktion S t displaystyle S t nbsp Exponentialverteilung e l t displaystyle e lambda t nbsp Weibull Verteilung e l t k displaystyle e lambda t k nbsp Log Normalverteilung F ln t m s 1 2 1 erf ln t m s 2 displaystyle Phi left frac ln t mu sigma right frac 1 2 left 1 operatorname erf left frac ln t mu sigma sqrt 2 right right nbsp Dabei bezeichnet F displaystyle Phi nbsp die Verteilungsfunktion der Standardnormalverteilung und erf displaystyle operatorname erf nbsp die Fehlerfunktion Schatzen der Parameter BearbeitenEreigniszeitmodelle kann man als normale Regressionsmodelle betrachten in der die Ergebnisvariable die Zeit ist Die Berechnung der Likelihood Funktion ist kompliziert da nicht zu jeder Zeit alle Informationen zur Verfugung stehen Wenn Geburt und Tod bekannt sind dann ist in diesem Fall der Lebensverlauf eindeutig Wenn man dagegen nur weiss dass die Geburt vor einem bestimmten Zeitpunkt stattfand dann nennt man diesen Datensatz links zensiert Genauso konnte nur bekannt sein dass der Tod nach einem bestimmten Datum eintrat Das ist dann ein rechts zensierter Datensatz Ein Lebenslauf kann auf diese Weise auch rechts und links zensiert sein intervallzensiert Falls eine Person die ein bestimmtes Alter nicht erreicht uberhaupt nicht beobachtet wird dann ist der Datensatz abgeschnitten engl truncated Bei einem links zensierten Datensatz wissen wir dagegen zumindest dass das Individuum existierte Es gibt einige Standardfalle fur zensierte und abgeschnittene Datensatze Ublich ist ein rechts zensierter Datensatz Betrachten wir eine Gruppe lebender Subjekte dann wissen wir dass sie heute am Leben sind Wir wissen aber nicht ihren in der Zukunft liegenden Todestag Links zensierte Daten sind auch ublich Wir konnten fur jedes Subjekt wissen dass es heute lebt aber wir kennen nicht den genauen Geburtstag Abgeschnittene Daten treten in Studien mit verzogertem Anfang auf Rentner konnten beispielsweise ab dem Alter 70 Jahre beobachtet werden Uber die Personen die vorher gestorben sind ist nicht einmal deren Existenz bekannt Die Likelihood Funktion fur ein Ereigniszeitmodell mit zensierten Daten kann wie folgt definiert werden 3 Definitionsgemass ist die Likelihood Funktion die gemeinsame Wahrscheinlichkeit der Daten bei vorgegebenen Modellparametern Es ist ublich anzunehmen dass die Daten unabhangig von den Parametern sind Dann ist die Likelihood Funktion das Produkt der Wahrscheinlichkeiten fur jede Ereigniszeit Wir teilen die Daten in vier Kategorien ein unzensierte links zensierte rechts zensierte und intervallzensierte Daten Wir unterscheiden sie in den Formeln mit unz l z r z und i z L 8 t i unz P T t i 8 t i l z P T lt t i 8 t i r z P T gt t i 8 t i i z P t i l lt T lt t i r 8 displaystyle L theta prod t i in text unz P T t i mid theta prod t i in text l z P T lt t i mid theta prod t i in text r z P T gt t i mid theta prod t i in text i z P t i l lt T lt t i r mid theta nbsp Fur eine unzensierte Ereigniszeit mit dem Todesalter t i displaystyle t i nbsp verwenden wir P T t i 8 f t i 8 displaystyle P T t i mid theta f t i mid theta nbsp Fur links zensierte Daten wissen wir nur dass der Tod vor einer Zeit t i displaystyle t i nbsp eintrat P T lt t i 8 F t i 8 1 S t i 8 displaystyle P T lt t i mid theta F t i mid theta 1 S t i mid theta nbsp Fur ein rechts zensiertes Individuum wissen wir dass der Tod nach der Zeit t i displaystyle t i nbsp eintritt also ist P T gt t i 8 S t i 8 displaystyle P T gt t i mid theta S t i mid theta nbsp Und fur intervallzensierte Ereignisse wissen wir dass der Tod zwischen T i r displaystyle T i r nbsp und T i l displaystyle T i l nbsp eintritt P t i l lt T lt t i r 8 S t i l 8 S t i r 8 displaystyle P t i l lt T lt t i r mid theta S t i l mid theta S t i r mid theta nbsp Anwendungen BearbeitenKredit Risiko 4 5 Falschverurteilungsrate von zum Tode verurteilter Haftlinge 6 Lieferzeiten fur metallische Komponenten in der Luft und Raumfahrtindustrie 7 Ruckfallzeiten in der Kriminalistik 8 Uberlebenszeiten von radio markierten Tieren 9 Uberlebenszeiten bis zum gewaltsamen Tod von Romischen Imperatoren 10 Wartezeiten zwischen zwei aufeinanderfolgenden Wertpapiergeschaften an elektronischen Borsen 11 Gute BearbeitenDie Gute von Ereigniszeitmodellen kann mit scoring rules bewertet werden 12 Siehe auch BearbeitenZensierte Daten QuantilsregressionLiteratur BearbeitenHans Jurgen Andress Einfuhrung in die Verlaufsdatenanalyse statistische Grundlagen und Anwendungsbeispiele zur Langsschnittanalyse kategorialer Daten In Historical Social Research Supplement 5 1992 S 1 323 urn nbn de 0168 ssoar 285968 Hans Peter Blossfeld Gotz Rohwer Katrin Golsch Event History Analysis with Stata Lawrence Erlbaum Associates Mahwah N J 2007 Regina Elandt Johnson Norman Johnson Survival Models and Data Analysis John Wiley amp Sons New York 1980 1999 Wolfgang Ludwig Mayerhofer Statistische Modellierung von Verlaufsdaten in der Analyse sozialer Probleme In Soziale Probleme Nr 5 6 1994 Mario Cleves u a An Introduction to Survival Analysis Using Stata 3 Auflage Stata Press 2010 Jerald F Lawless Statistical Models and Methods for Lifetime Data 2 Auflage John Wiley and Sons Hoboken 2003 Melinda Mills Introducing Survival and Event History Analysis Sage Publications 2011 Terry Therneau A Package for Survival Analysis in S Feb 1999 online Arno Meyna Bernhard Pauli Zuverlassigkeitstechnik Quantitative Bewertungsverfahren 2 Auflage Hanser 2010 ISBN 978 3 446 41966 7 Weblinks BearbeitenVerweildaueranalyse Eintrag im ILMES Internet Lexikon der Methoden der empirischen Sozialforschung A Ziegler S Lange R Bender Uberlebenszeitanalyse Eigenschaften und Kaplan Meier Methode Artikel Nr 15 der Statistik Serie in der DMW In DMW Deutsche Medizinische Wochenschrift 127 S T 14 doi 10 1055 s 2002 32819 Einzelnachweise Bearbeiten Christian FG Schendera Regressionsanalyse mit SPSS ISBN 978 3 486 71062 5 S 233 abgerufen uber De Gruyter Online Christian FG Schendera Regressionsanalyse mit SPSS ISBN 978 3 486 71062 5 S 233 abgerufen uber De Gruyter Online Mario Cleves William Gould Roberto G Gutierrez Yulia V Marchenko An Introduction to Survival Analysis Using Stata 3rd Edition Stata Press 2010 ISBN 978 1 59718 074 0 Maria Stepanova Lyn Thomas Survival Analysis Methods for Personal Loan Data In Operations Research 50 Jahrgang Nr 2 1 April 2002 ISSN 0030 364X S 277 289 doi 10 1287 opre 50 2 277 426 Dennis Glennon Peter Nigro Measuring the Default Risk of Small Business Loans A Survival Analysis Approach In Journal of Money Credit and Banking 37 Jahrgang Nr 5 2005 ISSN 0022 2879 S 923 947 doi 10 1353 mcb 2005 0051 JSTOR 3839153 Edward H Kennedy Chen Hu Barbara O Brien Samuel R Gross Rate of false conviction of criminal defendants who are sentenced to death In Proceedings of the National Academy of Sciences 111 Jahrgang Nr 20 20 Mai 2014 ISSN 0027 8424 S 7230 7235 doi 10 1073 pnas 1306417111 PMID 24778209 PMC 4034186 freier Volltext bibcode 2014PNAS 111 7230G englisch F J de Cos Juez P J Garcia Nieto J Martinez Torres J Taboada Castro Analysis of lead times of metallic components in the aerospace industry through a supported vector machine model In Mathematical and Computer Modelling Mathematical Models in Medicine Business amp Engineering 2009 52 Jahrgang Nr 7 1 Oktober 2010 ISSN 0895 7177 S 1177 1184 doi 10 1016 j mcm 2010 03 017 Andrew L Spivak Kelly R Damphousse Who Returns to Prison A Survival Analysis of Recidivism among Adult Offenders Released in Oklahoma 1985 2004 In Justice Research and Policy 8 Jahrgang Nr 2 2006 ISSN 1525 1071 S 57 88 doi 10 3818 jrp 8 2 2006 57 amerikanisches Englisch Kenneth H Pollock Scott R Winterstein Christine M Bunck Paul D Curtis Survival Analysis in Telemetry Studies The Staggered Entry Design In The Journal of Wildlife Management 53 Jahrgang Nr 1 1989 ISSN 0022 541X S 7 15 doi 10 2307 3801296 JSTOR 3801296 ncsu edu Joseph Homer Saleh Statistical reliability analysis for a most dangerous occupation Roman emperor In Palgrave Communications 5 Jahrgang Nr 1 23 Dezember 2019 ISSN 2055 1045 S 1 7 doi 10 1057 s41599 019 0366 y englisch Markus Kreer Ayse Kizilersu Anthony W Thomas Censored expectation maximization algorithm for mixtures Application to intertrade waiting times In Physica A Statistical Mechanics and its Applications 587 Jahrgang Nr 1 2022 ISSN 0378 4371 S 126456 doi 10 1016 j physa 2021 126456 sciencedirect com Proper Scoring Rules for Survival Analysis Hiroki Yanagisawa https arxiv org abs 2305 00621v3 Abgerufen von https de wikipedia org w index php title Ereigniszeitanalyse amp oldid 237870731