www.wikidata.de-de.nina.az
Unter Web Mining web mining auch Webmining versteht man die Ubertragung von Techniken des Data Mining zur teil automatischen Extraktion von Informationen aus dem Internet speziell dem World Wide Web Web Mining ubernimmt Verfahren und Methoden aus den Bereichen Information Retrieval maschinelles Lernen Statistik Mustererkennung und Data Mining Dabei konnen drei Untersuchungsgegenstande unterschieden werden Die Inhalte Web Content Mining beispielsweise mit Verfahren des Information Retrieval Die Struktur der Verlinkung Web Structure Mining beispielsweise mit Verfahren der Webometrie Beim Web Structure Mining kommen so genannte Hubs zum Einsatz Es gibt gute Hubs die auf viele wertvolle Seiten verweisen und wertvolle Seiten auf die viele Hubs verweisen Das Benutzerverhalten Web Usage Mining beispielsweise durch die Analyse von Logdateien Inhaltsverzeichnis 1 Arten des Web Minings 2 Siehe auch 3 Literatur 4 WeblinksArten des Web Minings BearbeitenWeb Usage Mining versucht Regularitaten in der Benutzung von Webseiten beziehungsweise Webressourcen zu erkennen Dabei werden alle sekundaren Daten die durch Interaktion des Benutzers mit einer Webressource entstehen verarbeitet und analysiert Zum Web Usage Mining gehort beispielsweise auch die Analyse der Customer Journey Web Structure Mining versucht die einer Webseite beziehungsweise Domane zugrunde liegende Verweisstruktur zu erkennen Basierend auf der Topologie der Verweise Hyperlinks der Webseite mit optionaler Beschreibung derselben wird ein Modell erstellt Dieses kann fur die Kategorisierung und das Ranking einer Webseite nutzlich sein und lasst Ruckschlusse auf Ahnlichkeiten zwischen Webseiten und deren Beziehungen zueinander zu Zum Beispiel konnten inhaltsreiche Webseiten sog Authorities und uberblicksartige Webseiten sogenannte Hubs fur ein bestimmtes Thema ausfindig gemacht werden vgl HITS Algorithmus Web Content Mining befasst sich mit der Erkennung von Regularitaten in den Inhalten einer Webressource Web Content Mining ist ein Anwendungsgebiet fur das Text Mining Die Daten im Web bestehen aus unstrukturierten Daten wie Textdokumenten semi strukturierten Daten wie HTML Dokumenten und starker strukturierten Daten wie Tabellen oder dynamisch generierten HTML Seiten Grundsatzlich bestehen die Inhalte einer Webseite aus verschiedenen Datentypen wie Texten Bildern Audio Video Metadaten und Hyperlinks Web Content Mining von multiplen Datentypen wird als Multimedia Data Mining bezeichnet und kann als Teil von Web Content Mining verstanden werden Hauptsachlich bestehen die Inhalte des Webs jedoch aus unstrukturiertem Text Text Mining kann als Auspragung und ubergeordnetes Forschungsgebiet von Web Content Mining verstanden werden Die verwendeten Methoden sind allgemeine Data Mining Methoden wobei statistische und computerlinguistische Verfahren die Transformation der Texte in eine fur das Data Mining adaquate Form realisieren Siehe auch BearbeitenText Mining Suchmaschine Semantisches Web Screen ScrapingLiteratur BearbeitenRaymond Kosala Hendrik Blockeel Web Mining Research A Survey In SIGKDD Explorations 2 Nr 1 2000 Seite 1 10 Marc Ehrig Jens Hartmann Christoph Schmitz Ontologiebasiertes Web Mining PDF 255 kB In Peter Dadam Hrsg Informatik 2004 Informatik verbindet Beitrage der 34 Jahrestagung der Gesellschaft fur Informatik Kollen Bonn 2004 ISBN 3 88579 380 6 Seite 187 193 Frank Bensberg Web log mining als Instrument der Marketingforschung Gabler Wiesbaden 2001 ISBN 3 8244 7309 7 Markus Leibold Web log mining im PR Controlling VDM Munchen 2006 ISBN 978 3 86550 392 3 Weblinks Bearbeitenhttp www cs umbc edu kolari1 Mining webmining html Linksammlung wissenschaftlicher Artikel http www mindup de html web mining html Review Artikel YALE Yet Another Learning Environment freie Open Source Software fur Knowledge Discovery Data Mining inklusive Web Mining und Text Mining Maschinelles Lernen etc heute RapidMiner YALE bietet zusammen mit dem ebenfalls freien WordVectorTool eine kostenlose komplette Software Umgebung fur zahlreiche Web Mining und Text Mining Aufgaben Idea Web Miner freies Tool fur Web Content Mining einschliesslich Web Log Mining Web Patent Mining und Web News Mining Abgerufen von https de wikipedia org w index php title Web Mining amp oldid 205906774