www.wikidata.de-de.nina.az
Environment for DeveLoping KDD Applications Supported by Index Structures ELKI auf Deutsch etwa Umgebung zur Entwicklung von Wissensentdeckung Anwendungen mit Indexstruktur Unterstutzung ist ein Forschungsprojekt das ursprunglich am Datenbanken Lehrstuhl von Professor Hans Peter Kriegel an der Ludwig Maximilians Universitat Munchen entwickelt wurde und jetzt an der Technischen Universitat Dortmund weitergefuhrt wird Environment for DeveLoping KDD Applications Supported by Index StructuresELKI 0 4 visualisiert OPTICS ErgebnisBasisdatenMaintainer Technische Universitat DortmundEntwickler Ludwig Maximilians Universitat MunchenAktuelle Version 0 8 0 5 Oktober 2022 Betriebssystem PlattformunabhangigProgrammiersprache JavaKategorie Data Mining Forschung Mathematik StatistikLizenz AGPL von Version 0 4 0 an https elki project github io Es handelt sich um ein in Java geschriebenes modulares Softwarepaket Framework zur Knowledge Discovery in Databases Der Fokus liegt auf Verfahren zur Clusteranalyse Ausreisser Erkennung 1 sowie der Verwendung von Indexstrukturen in solchen Verfahren Als Forschungsprojekt einer Universitat liegt der Fokus auf einer einfachen Erweiterbarkeit Lesbarkeit und in der Verwendung in Forschung und Lehre an der Universitat nicht in maximaler Geschwindigkeit oder in der Integration mit bestehenden Business Intelligence Anwendungen So verfugt bisher beispielsweise keine der freigegebenen Versionen uber eine Datenbankschnittstelle zu bestehenden industriellen Datenbanksystemen und eine Verwendung der Software setzt Vorwissen und ein Lesen der Dokumentation voraus Die Zielgruppe fur das Projekt sind Forscher Studenten und Softwareentwickler Die modulare Architektur der Software erlaubt zahlreiche Kombinationen der enthaltenen Algorithmen Datentypen Distanzmassen und Indexstrukturen Bei der Entwicklung neuer Verfahren oder Distanzen kann daher das neue Modul einfach mit den bestehenden Modulen kombiniert und evaluiert werden Die Visualisierungsmodule erlauben es dabei oft die Ergebnisse einfach darzustellen und so zu vergleichen Der Entwicklungsaufwand und die Entwicklungszeit solcher Module wird durch die Wiederverwendung bestehenden Programmcodes erheblich vereinfacht so dass die Software gut als Basis fur Seminar Diplom und Master Arbeiten verwendet werden kann Inhaltsverzeichnis 1 Enthaltene Algorithmen 2 Versionsgeschichte 3 Auszeichnungen 4 Verwandte Anwendungen 5 Weblinks 6 EinzelnachweiseEnthaltene Algorithmen BearbeitenIn ELKI enthalten sind unter anderem folgende Algorithmen Auszug 2 3 4 K Means Clustering EM Algorithmus Expectation Maximization Algorithmus Apriori Algorithmus Single linkage clustering Hierarchische Clusteranalyse DBSCAN Density Based Spatial Clustering of Applications with Noise OPTICS Ordering Points To Identify the Clustering Structure inklusive der Weiterentwicklungen OPTICS OF DeLiClu HiSC HiCO und DiSH Local Outlier Factor LOF R Baum R Baum und M Baum Multidimensionale SkalierungVersionsgeschichte BearbeitenVersion 0 1 Juli 2008 enthielt bereits zahlreiche Algorithmen aus den Bereichen Clusteranalyse und Ausreisser Erkennung sowie einige Indexstrukturen wie den R Baum Der Fokus des ersten Releases war auf Subspace Clustering Verfahren 5 Version 0 2 Juli 2009 fugte Funktionen zur Zeitreihenanalyse hinzu insbesondere Distanzfunktionen hierfur 6 Version 0 3 Marz 2010 erweiterte die Auswahl an Outlier Detection Algorithmen und Visualisierungsmodulen 7 Version 0 4 August 2011 fugt zahlreiche Verfahren zum Erkennen von raumlichen Ausreissern in Geodaten hinzu 8 Version 0 5 April 2012 hat den Schwerpunkt der Evaluierung von Clusteranalyse Ergebnissen neue Visualisierungen und ein paar neue Algorithmen 9 Version 0 6 Juni 2013 Januar 2014 kommt mit einer Erweiterung fur 3D Parallele Koordinaten und zusatzlichen Algorithmen 10 Version 0 7 August 2015 fugt unsichere Datentypen und Algorithmen fur unsichere Daten hinzu 11 Version 0 7 5 Februar 2019 fugt zusatzliche Clusteringverfahren Ausreissermethoden Evaluationsmasse und Indexstrukturen hinzu 4 Auszeichnungen BearbeitenELKI begann als Implementation 12 der Doktorarbeit von Arthur Zimek 13 die den SIGKDD Doctoral Dissertation Award 2009 Runner up 14 der Association for Computing Machinery fur ihre Beitrage zum Correlation Clustering gewann Die im Zuge der Dissertation publizierten Algorithmen 4C COPAC HiCO ERiC CASH zusammen mit ein paar Vorlaufern und Vergleichsverfahren sind in ELKI verfugbar 12 Die Demonstration der Version 0 4 auf der Konferenz Symposium on Spatial and Temporal Databases 2011 mit den Geo Outlier Erweiterungen fur ELKI 8 gewann den Best Demonstration Paper Award der Konferenz Verwandte Anwendungen BearbeitenKNIME Konstanz Information Miner Projekt der Universitat Konstanz zur interaktiven Datenanalyse in Eclipse RapidMiner eine frei und kommerziell verfugbare Anwendung mit dem Schwerpunkt maschinelles Lernen Scikit learn Python Projekt mit Verfahren aus dem maschinellen Lernen WEKA ein ahnliches Projekt der Universitat Waikato mit einem Schwerpunkt auf Klassifizierungs Algorithmen Weblinks BearbeitenOffizielle Website von ELKIEinzelnachweise Bearbeiten Hans Peter Kriegel Peer Kroger Arthur Zimek Outlier Detection Techniques Tutorial In 13th Pacific Asia Conference on Knowledge Discovery and Data Mining PAKDD 2009 Bangkok Thailand 2009 dbs ifi lmu de PDF 1000 kB abgerufen am 26 Marz 2010 ELKI references overview Literaturquellen zu Funktionalitat in ELKI Abgerufen am 29 Oktober 2019 englisch Data Mining Algorithms in ELKI Liste der implementierten Algorithmen Abgerufen am 29 Oktober 2019 englisch a b Erich Schubert Arthur Zimek ELKI A large open source library for data analysis ELKI Release 0 7 5 Heidelberg 10 Februar 2019 arxiv 1902 03616 cs LG Elke Achtert Hans Peter Kriegel Arthur Zimek ELKI A Software System for Evaluation of Subspace Clustering Algorithms In Proceedings of the 20th international conference on Scientific and Statistical Database Management SSDBM 08 Springer Verlag Hong Kong China 2008 doi 10 1007 978 3 540 69497 7 41 dbs ifi lmu de PDF 80 kB Elke Achtert Thomas Bernecker Hans Peter Kriegel Erich Schubert Arthur Zimek ELKI in time ELKI 0 2 for the performance evaluation of distance measures for time series In Proceedings of the 11th International Symposium on Advances in Spatial and Temporal Databases SSTD 2010 Springer Verlag Aalborg 2009 doi 10 1007 978 3 642 02982 0 35 dbs ifi lmu de PDF 230 kB Elke Achtert Hans Peter Kriegel Lisa Reichert Erich Schubert Remigius Wojdanowski Arthur Zimek Visual Evaluation of Outlier Detection Models In 15th International Conference on Database Systems for Advanced Applications DASFAA 2010 Springer Verlag Tsukuba Japan 2010 doi 10 1007 978 3 642 12098 5 34 a b Elke Achtert Achmed Hettab Hans Peter Kriegel Erich Schubert Arthur Zimek Spatial Outlier Detection Data Algorithms Visualizations In 12th International Symposium on Spatial and Temporal Databases SSTD 2011 Minneapolis MN 2011 doi 10 1007 978 3 642 22922 0 41 Elke Achtert Sascha Goldhofer Hans Peter Kriegel Erich Schubert Arthur Zimek Evaluation of Clusterings Metrics and Visual Support In 28th International Conference on Data Engineering ICDE Washington DC 2012 doi 10 1109 ICDE 2012 128 Elke Achtert Hans Peter Kriegel Erich Schubert Arthur Zimek Interactive Data Mining with 3D Parallel Coordinate Trees In Proceedings of the ACM International Conference on Management of Data ACM SIGMOD New York City 2013 doi 10 1145 2463676 2463696 Erich Schubert Alexander Koos Tobias Emrich Andreas Zufle Klaus Arthur Schmid Arthur Zimek A Framework for Clustering Uncertain Data In Proceedings of the VLDB Endowment Band 8 Nr 12 2015 S 1976 1987 vldb org PDF a b Arthur Zimek Correlation clustering In ACM SIGKDD Hrsg ACM SIGKDD Explorations Newsletter Band 11 Nr 1 2009 S 53 54 doi 10 1145 1656274 1656286 Arthur Zimek Correlation Clustering Doktorarbeit Ludwig Maximilians Universitat Munchen Munchen 2008 urn nbn de bvb 19 87361 edoc ub uni muenchen de PDF SIGKDD Doctoral Dissertation Award Nicht mehr online verfugbar ACM SIGKDD archiviert vom Original am 29 November 2010 abgerufen am 16 April 2011 englisch Abgerufen von https de wikipedia org w index php title Environment for DeveLoping KDD Applications Supported by Index Structures amp oldid 232147554