www.wikidata.de-de.nina.az
Die Merkmalexploration ist ein interaktiver Algorithmus der Formalen Begriffsanalyse zum Finden von Implikationen zwischen Merkmalen von Daten Der Algorithmus berechnet eine vollstandige und minimale Stammbasis aus der alle im untersuchten Gebiet geltenden Implikationen gefolgert werden konnen Inhaltsverzeichnis 1 Idee 2 Mathematische Grundlagen 2 1 Pseudohullen 2 2 Implikationen und Stammbasis 3 Beispiel 4 Exploration mit Hintergrundwissen 5 Anwendungsgebiete 6 Software 7 Literatur 8 Weblinks 9 EinzelnachweiseIdee BearbeitenZiel der Merkmalexploration ist es alle moglichen Merkmalkombinationen in einem speziellen Sachbereich zu beschreiben d h die Merkmallogik zu finden Dieser Sachbereich ist durch einen formalen Kontext gegeben der grundlegenden Datenstruktur der Formalen Begriffsanalyse In dieser Kreuztabelle sind Beziehungen zwischen Gegenstanden und Merkmalen verzeichnet Mit Hilfe von Implikationen in einer Erweiterung auch Klauseln werden Abhangigkeiten und Zusammenhange seitens der Merkmale erklart Die Hauptaufgabe ist es eine Stammbasis zu bestimmen Dabei geht man von einer Sammlung von Beispielen aus die in einem Teilkontext gegeben sind Der Algorithmus schlagt in einer eindeutig bestimmten Reihenfolge einem Experten oder einem unterstutzenden Programm im Teilkontext geltende Implikationen vor Akzeptiert der Experte diese werden sie in die Stammbasis aufgenommen Im anderen Fall muss der Experte ein Gegenbeispiel liefern d h eine neue Zeile des Kontexts So konnen selbst unendliche Mengen von Objekten bei endlicher Merkmalmenge untersucht werden Es ist auch moglich fur einen gegebenen Datensatz automatisch die Stammbasis zu berechnen dann werden alle vorgeschlagenen Implikationen akzeptiert Mathematische Grundlagen BearbeitenPseudohullen Bearbeiten Sei X X displaystyle X mapsto X nbsp ein Hullenoperator auf der endlichen Merkmalsmenge M Eine Teilmenge P M displaystyle P subseteq M nbsp heisst Pseudohulle genau dann wenn sie die folgenden Bedingungen erfullt P P displaystyle P neq P nbsp P displaystyle P nbsp enthalt die Hulle Q displaystyle Q nbsp jeder Pseudohulle Q displaystyle Q nbsp die echte Teilmenge von P displaystyle P nbsp ist Implikationen und Stammbasis Bearbeiten Eine Implikation auf einer Menge M ist ein Paar von Teilmengen von M Notation A B displaystyle A rightarrow B nbsp Eine Teilmenge T M displaystyle T subseteq M nbsp respektiert eine Implikation A B displaystyle A rightarrow B nbsp wenn A T displaystyle A not subseteq T nbsp oder B T displaystyle B subseteq T nbsp gilt A B displaystyle A rightarrow B nbsp gilt in einem formalen Kontext G M I displaystyle G M I nbsp wenn jeder Gegenstandsinhalt g displaystyle g nbsp also jede Zeile des Kontexts die Implikation respektiert Eine Implikation A B displaystyle A rightarrow B nbsp folgt aus einer Menge L displaystyle mathcal L nbsp von Implikationen per Definition genau dann wenn A B displaystyle A rightarrow B nbsp in jedem formalen Kontext gilt in dem auch jede Implikation aus L displaystyle mathcal L nbsp gultig ist Betrachtet man die Menge aller Implikationen die auf einem Kontext gelten stellt sich die Frage ob es eine Teilmenge L displaystyle mathcal L nbsp gibt die alle diese Implikationen reprasentiert Eine solche Basis muss folgende Bedingungen erfullen Jede Implikation aus L displaystyle mathcal L nbsp gilt im formalen Kontext Korrektheit Jede Implikation die im Kontext gilt folgt aus L displaystyle mathcal L nbsp Vollstandigkeit Keine Implikation A B L displaystyle A rightarrow B in mathcal L nbsp folgt aus den ubrigen Implikationen also aus L A B displaystyle mathcal L setminus A rightarrow B nbsp Irredundanz Vincent Duquenne und Jean Louis Guigues haben gezeigt dass fur endliche Merkmalmengen eine solche Basis existiert 1 Sie ist sogar eindeutig bestimmbar und von minimaler Kardinalitat unter allen moglichen Implikationenbasen Hierfur gibt es verschiedene Bezeichnungen Stammbasis kanonische Basis oder auch D G Basis Die Stammbasis eines formalen Kontextes G M I displaystyle G M I nbsp ist die Menge der Implikationen P P P ist Pseudoinhalt von G M I displaystyle left P mapsto P mid P text ist Pseudoinhalt von G M I right nbsp Beispiel Bearbeiten nbsp Formaler Kontext unvollstandig zur Lage zweier Quadrate in der Ebene nbsp Begriffsverband nach Abschluss der Merkmalexploration Der Ausgangspunkt ist ein meist unvollstandiger oder auch leerer Teilkontext Der Algorithmus schlagt im Teilkontext geltende Implikationen P P displaystyle P longrightarrow P nbsp vor Der Experte kann sie akzeptieren oder ein Gegenbeispiel angeben ce pa cv cs akzeptiert cs pa akzeptiert pa cv cs ce akzeptiert ov cv pa cs ce Gegenbeispiel neuer Gegenstand mit Merkmalen ov und cv ov pa cs cv ce Gegenbeispiel neuer Gegenstand mit Merkmalen ov pa und cs ov pa cv cs ce akzeptiert di cv alle Merkmale widerspruchliche Pramisse die entsprechende Gegenstandsmenge ist leer akzeptiert di pa cs alle Merkmale akzeptiert di ov alle Merkmale akzeptiertDie vom Experten akzeptierten Implikationen bilden die Stammbasis Die Begriffsinhalte des erweiterten Kontexts und damit der Begriffsverband sind durch diese eindeutig bestimmt Exploration mit Hintergrundwissen Bearbeiten nbsp Formaler Kontext zum Bestehen einer Fuhrerscheinprufung Die Stammbasis 2 zum nebenstehenden Beispiel ist P G displaystyle P longrightarrow G nbsp T G displaystyle T longrightarrow G nbsp G P T displaystyle G P longrightarrow T nbsp G T P displaystyle G T longrightarrow P nbsp T P G displaystyle T P longrightarrow G nbsp G T P displaystyle G longrightarrow T P nbsp G T P P displaystyle G T P P longrightarrow bot nbsp G T T P displaystyle G T T P longrightarrow bot nbsp Dies ist allerdings eine etwas komplizierte Form die einfache Aquivalenz auszudrucken G T P displaystyle G longleftrightarrow T P nbsp dd dd Nur diese beiden Implikationen erhalt man als Stammbasis wenn man die Negation der Merkmale bestanden nicht bestanden durch die Implikation G G displaystyle G wedge G longrightarrow bot nbsp sowie die Vollstandigkeit der Information durch die Klausel G G displaystyle top multimap G vee G nbsp dem Algorithmus als Startwissen ubergibt analog fur die anderen Merkmale P und T Verfugt man also uber Hintergrundwissen kann die Merkmalexploration abgekurzt und die Stammbasis verkleinert werden So kann etwa eine Menge L displaystyle mathcal L nbsp von kumulierten Klauseln A i I B i A B i M displaystyle bigwedge A rightarrow bigvee bigwedge i in I B i A B i in M nbsp verwendet werden die ausdrucksstarker als Implikationen sind Die Stammbasis besteht dann aus einer Menge von Implikationen B displaystyle mathcal B nbsp jeweils mit Pramissen P die unter dem Hintergrundwissen abgeschlossen sind also alle Merkmale enthalten die durch das Hintergrundwissen gefordert sind Fur Implikationen als Hintergrundwissen bedeutet das eine wiederholte Anwendung des wie folgt definierten L displaystyle mathcal L nbsp Operators auf P X L X B M A X A B L displaystyle X mathcal L X cup bigcup B subseteq M mid A subseteq X A rightarrow B in mathcal L nbsp dd dd Die gultigen Implikationen des zugrunde liegenden Kontexts konnen dann aus L B displaystyle mathcal L cup mathcal B nbsp gefolgert werden 3 Diese Stammbasis bezuglich eines durch das Hintergrundwissen definierten relativen Testkontexts ist allerdings nicht in jedem Fall eindeutig bestimmt 4 Anwendungsgebiete BearbeitenMit Hilfe der Merkmalexploration lassen sich Datensatze auf Vollstandigkeit uberprufen Funktionale Abhangigkeiten sowie Assoziationsregeln finden und in kompakter Form darstellen oder in Beschreibungslogiken ausgedruckte Wissensbasen vervollstandigen 5 Eine Anwendung in der Systembiologie zielt mittels Integration von Wissen und experimentellen Daten auf Prozessregeln fur genregulatorische und andere Netzwerke 6 In der Mathematik dient die Merkmalexploration dem Strukturieren von Beweisen Software BearbeitenConcept Explorer Einfach zu bedienendes grafisches Java Programm mit den wichtigsten Funktionen einschliesslich Erzeugen eines Begriffsverbands Die Eingabe von Hintergrund Implikationen beim Aufruf aus einem eigenen Java Programm ist moglich Conexp ng Erweiterbare Java Neuimplementierung von Concept Explorer Conexp clj Neuimplementierung im Java basierten Lisp Dialekt Clojure Insbesondere fur Kommandozeilen Aufruf und skriptbasierte Programmierung geeignet mit erweiterten Moglichkeiten wie Luxenburger Basen Kontext Automorphismen Symmetrien der Merkmale Fuzzy FCA oder einer Schnittstelle zum Computeralgebra System Sage ConImp Fur Linux und DOS Windows kommandozeilenbasiert beschrankt auf formale Kontexte mit 256 Gegenstanden jedoch mit erweiterten Optionen wie Eingabe von Hintergrund und unvollstandigem Wissen Hintergrundwissen verandert dort im Unterschied zum oben beschriebenen und in conexp clj implementierten Ansatz den Algorithmus nicht sondern es werden vorgeschlagene Implikationen durch Folgern aus einer Menge von Hintergrund Implikationen entschieden nicht durch den Experten Literatur BearbeitenBernhard Ganter Rudolf Wille Formale Begriffsanalyse Springer 1996 ISBN 3 540 60868 0 Bernhard Ganter Sergei Obiedkov Conceptual Exploration Springer 2016 ISBN 978 3 662 49290 1Weblinks BearbeitenDresdener Seite zur Formalen Begriffsanalyse englisch Dort Vorlesungsfolien PDF 2 1 MB als ausfuhrliche Einfuhrung zu FCA und Merkmalexploration Einzelnachweise Bearbeiten Bernhard Ganter Rudolf Wille Formale Begriffsanalyse Springer 1996 ISBN 3 540 60868 0 Theorem 8 S 85 Bernhard Ganter Finger Exercises in Formal Concept Analysis PDF 2 1 MB Vorlesungsfolien Dresden 2006 S 85 87 Gerd Stumme Attribute Exploration with Background Knowledge and Exceptions In H H Bock u a Data Analysis and Information Systems Springer 1996 S 457 469 Preprint PDF 219 kB Bernhard Ganter Contextual Attribute Logic of Many Valued Attributes In Bernhard Ganter Gerd Stumme Rudolf Wille Hrsg Formal Concept Analysis Foundations and Applications Springer 2005 ISBN 3 540 27891 5 S 107 Online Version Franz Baader and Baris Sertkaya Usability Issues in Description Logic Knowledge Base Completion In S Ferre and S Rudolph Hrsg Formal Concept Analysis 7th International Conference ICFCA 2009 LNAI 5548 Springer Heidelberg 2009 p 1 21 Johannes Wollbold Attribute Exploration of Gene Regulatory Processes PDF 4 4 MB Doktorarbeit Universitat Jena 2011 Abgerufen von https de wikipedia org w index php title Merkmalexploration amp oldid 238119293