www.wikidata.de-de.nina.az
Dieser Artikel oder Abschnitt bedarf einer grundsatzlichen Uberarbeitung Naheres sollte auf der Diskussionsseite angegeben sein Bitte hilf mit ihn zu verbessern und entferne anschliessend diese Markierung Die Relief Algorithmen eine Familie von Algorithmen zur Feature Selection fur uberwachte Lernmethoden des maschinellen Lernens welche ab 1992 entwickelt wurden Es ist ein Werkzeug zur nachtraglichen Untersuchung der Frage welches Attribut den grossten bzw geringsten Einfluss auf die Ausgabe eines Modells hatte Fur ihre Anwendung ist zunachst die Definition einer Entfernung zwischen zwei Instanzen erforderlich die sich aus den Differenzen zwischen den Attributen fur jede der Instanzen ergibt Die Gesamtheit aller moglichen Instanzen wird auch als Instanzraum bezeichnet Dieser ist i A kein Vektorraum im mathematischen Sinne da gewohnlich keine Vektoraddition sinnvoll definierbar ist ebenso wenig die Multiplikation mit einer Zahl Es ist aber sehr wohl ein metrischer Raum da fur je zwei Instanzen eine Entfernung s o definiert ist Die Differenz der Attributwerte zweier Instanzen ist auch fur nominale Werte definiert namlich ursprunglich als 0 falls die Instanzen in diesem Attribut ubereinstimmen und sonst als 1 Eine Moglichkeit die Entfernung zwischen den Instanzen zu berechnen ist die Manhattan Distanz die Summe aller Differenzbetrage Inhaltsverzeichnis 1 Ein einfaches Beispiel 2 Kurze Skizzierung der Funktionsweise von Relief 3 Grenzen von Relief und seine Erweiterung 4 LiteraturEin einfaches Beispiel BearbeitenUm dem theoretischen Gerippe von vornherein etwas Fleisch hinzuzufugen sei hier gleich zu Anfang ein einfaches Beispiel mit nominalen Attributen angefugt um die Begriffe zu verdeutlichen Attribute Ausblick Temperatur Luftfeuchtigkeit windig Klasse spielen mogl Werte sonnig kuhl normal nein Kl wert ja veranderlich mild hoch ja nein regnerisch heiss Es gibt hier 4 Attribute von denen zwei 3 und die anderen 2 Werte annehmen konnen Eine Instanz ist hier eine konkrete Wetterlage und 3 3 2 2 36 verschiedene Wetterlagen sind in diesem Beispiel theoretisch moglich Der Entscheidungsprozess liefert zwei Moglichkeiten Zielgrosse ist die Entscheidung ob bei einem Wetter draussen gespielt werden kann oder nicht damit ergeben sich zwei Klassen von Beispielen Instanzen Jede Instanz gehort entweder der Klasse spielen oder der Klasse nicht spielen an Die grosste mogliche Entfernung zwischen zwei Instanzen ist in diesem Falle 4 fur die Extremfalle Wenn man als I ein Wetter wahlt bei dem draussen gespielt wird muss H ein ahnliches Wetter sein bei dem ebenfalls gespielt wird und M ein Wetter das nicht weit von I entfernt ist bei dem aber gerade nicht mehr gespielt wird Kurze Skizzierung der Funktionsweise von Relief Bearbeiten nbsp Illustration des Relief Algorithmus Die Relief Algorithmen verandern die Gewichte jedes Attributes A in Abhangigkeit davon wie gross die Differenzen benachbarter Instanzen sowohl gleicher als auch unterschiedlicher Klasse in A ist Schliesslich kann man an den Gewichten die Relief einer Grosse verliehen hat deren Einfluss auf das Ergebnis eines Entscheidungsprozesses ablesen den sogenannten Klassenwert einer Instanz Im Falle des einfachsten Algorithmus Relief funktioniert das nur fur zwei Klassen das heisst die Zielgrosse kann zwei Werte annehmen und die Daten mussen vollstandig sein Zunachst pickt sich Relief eine Instanz I heraus und ermittelt dann deren nachste Nachbarn einen aus der eigenen nearest hit also nachster Treffer genannt und mit H bezeichnet und einen aus der anderen Klasse nearest miss also nachster Verfehler mit M bezeichnet Die Gewichte aller Attribute in denen die I mit H ubereinstimmt oder mit M nicht ubereinstimmt werden erhoht die Gewichte derer in denen I sich von H unterscheidet oder mit M ubereinstimmt werden verringert Falls die Attribute numerisch sind hangt der Grad dieser Veranderung von der Differenz zwischen den Attributwerten ab Grenzen von Relief und seine Erweiterung BearbeitenVoraussetzungen fur die Anwendbarkeit von Relief ist dass genau zwei Klassen definiert sind und keine Daten fehlen Ausserdem konnen auch verrauschte Daten die Aussagekraft des Algorithmus beeintrachtigen In diesem Falle muss Relief erweitert werden Solche Erweiterungen werden im Allgemeinen durch einen Grossbuchstaben von A bis F gekennzeichnet ReliefA hat die gleichen Voraussetzungen wie Relief sucht jedoch nicht nur nach je einem sondern nach je k nachsten Nachbarn einer ausgewahlten Instanz in deren und in der anderen Klasse k ist dabei ein benutzerdefinierter Parameter ReliefB und ReliefC modifizieren die Definition fur die normierte Differenz zwischen zwei Attributwerten Somit kann man auch Instanzen einbeziehen die fur einzelne Attribute keinen bekannten Wert haben Hier ist die Differenz zweier Instanzen in einem Attribut A als 1 1 Zahl der Werte von A definiert ReliefD stellt eine weitere Modifikation dar bei der die Differenzfunktion noch etwas komplizierter aber intelligenter definiert ist Dabei spielen bedingte Wahrscheinlichkeiten eine grosse Rolle die nach den relativen Haufigkeiten von Attributwerten innerhalb der einzelnen Klassen geschatzt werden Schliesslich kann auch der Klassenwert mehr als zwei u U numerische Werte annehmen In unserem Wetterbeispiel ware es etwa moglich neben der Entscheidung ob man uberhaupt draussen spielen will auch die Moglichkeit zuzulassen wie lange man spielt In diesem Falle kann ein Algorithmus entweder nach dem Zufallsprinzip einen nachsten Nachbarn aus irgendeiner der anderen Klassen auswahlen so macht es ReliefE und wie gehabt einen aus derselben Klasse oder er sucht fur eine gewahlte Instanz aus jeder der k anderen Klassen einen und aus der eigenen k nachste Nachbarn so macht es ReliefF Literatur BearbeitenM Robnik Sikonja I Kononenko Theoretical and empirical analysis of ReliefF and RReliefF Machine Learning 53 1 2 23 69 2003 doi 10 1023 A 1025667309714 Ian H Witten E Frank Data Mining Praktische Werkzeuge und Techniken fur das maschinelle Lernen Carl Hanser Verlag Munchen Wien 2001 Qi Zhong Using RELIEF to select Features on Mice Gene Data Machine Learning Winter 2004 Abgerufen von https de wikipedia org w index php title Relief Algorithmus amp oldid 243859767