www.wikidata.de-de.nina.az
Knowledge Discovery in Databases KDD auf Deutsch Wissensentdeckung in Datenbanken erganzt das oft synonym gebrauchte Data Mining um vorbereitende Untersuchungen und Transformationen auszuwertender Daten Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhange aus vorhandenen meist grossen Datenbestanden In Abgrenzung zum Data Mining umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die Bewertung der Resultate Der Begriff KDD wurde in wissenschaftlichen Kreisen von Gregory Piatetsky Shapiro gepragt wahrend in der Praxis der Begriff Data Mining gelaufiger ist der in der Statistik jedoch traditionell negativ besetzt ist Die Teilschritte des KDD Prozesses sind Bereitstellung von Hintergrundwissen fur den jeweiligen Fachbereich Definition der Ziele der Wissensfindung Datenauswahl Datenbereinigung Datenreduktion z B durch Transformationen Auswahl eines Modells in dem das gefundene Wissen reprasentiert werden soll Data Mining die eigentliche Datenanalyse Interpretation der gewonnenen ErkenntnisseUblicherweise werden diese Schritte mehrfach durchlaufen Ein verbreitetes Vorgehensmodell ist der Cross Industry Standard Process for Data Mining CRISP DM Software BearbeitenELKI ist ein Forschungsprojekt der Ludwig Maximilians Universitat Munchen das zahlreiche Data Mining Algorithmen enthalt vor allem zur Clusteranalyse und Outlier Erkennung aber auch Indexstrukturen zur Verwendung in Lehre und Forschung KNIME ist ein frei erhaltliches Open Source Tool fur die interaktive Datenanalyse und Data Mining Ontop ist ein frei erhaltliches Open Source Virtual Knowledge Graph System RapidMiner ist ein frei erhaltliches Open Source Tool fur Maschinelles Lernen Data Mining und Predictive analytics das alle Schritte des Wissensentdeckungsprozesses von der Datenauswahl Datenbereinigung Datenreduktion und transformation uber die Modellbildung und Validierung bis zur Visualisierung und dem Deployment unterstutzt Splunk ist eine Softwareplattform fur Textdaten Die kostenlose Version ist auf die Indexierung von 500 MB pro Tag beschrankt und wesentliche Analysen wie Cluster Analyse sind der kommerziellen Version vorbehalten Weka ist ein Open Source Tool welches von der Universitat von Waikato entwickelt wurde Es enthalt eine umfangreiche Sammlung von Algorithmen zur Knowledge Discovery in Databases Wolfram Alpha ist eine kostenlos nutzbare Wissensdatenbank mit der auch etwas Datenanalyse moglich ist Literatur BearbeitenMartin Ester Jorg Sander Knowledge Discovery in Databases Techniken und Anwendungen Springer Berlin 2000 ISBN 3 540 67328 8 Fayyad Usama Piatetsky Shapiro Gregory und Smyth Padhraic 1996 From Data Mining to Knowledge Discovery in Databases AI Magazine American Association for Artificial Intelligence California USA Seite 37 54 Alpar Paul und Niederreichholz Joachim 2000 Data Mining im praktischen Einsatz Verfahren und Anwendungsfalle fur Marketing Vertrieb Controlling und Kundenunterstutzung Vieweg Verlag Wiesbaden Deutschland Abgerufen von https de wikipedia org w index php title Knowledge Discovery in Databases amp oldid 209106870