www.wikidata.de-de.nina.az
Ein Data Lake wortlich ubersetzt Datensee ist in der Wirtschaftsinformatik ein System oder ein Repository von Daten die im Rohdatenformat gespeichert sind normalerweise Blobs oder Dateien Ein Data Lake ist in der Regel ein einziger Speicher fur alle Unternehmensdaten einschliesslich Rohkopien von Quellsystemdaten und transformierten Daten die fur Aufgaben wie Berichterstellung Visualisierung erweiterte Analysen und maschinelles Lernen verwendet werden Ein Data Lake kann strukturierte Daten aus relationalen Datenbanken Zeilen und Spalten aus CSV XML oder JSON Formaten oder unstrukturierte Daten zum Beispiel E Mails Dokumente PDF Dateien und binare Daten Bild Ton Speicherabbilder enthalten DatensammlungData Lakes werden in Branchen wie Einzelhandel Bankwesen oder Hotel und Gastgewerbe und sogar in der Reisebranche verwendet fur die Verfolgung und die Vorhersage von Kundenvorlieben und die Verbesserung der gesamten Kundenerfahrung 1 Neben den Daten werden auch generische Analysemethoden abgelegt sodass diese ebenfalls fur die zentral gespeicherten Daten zur Verfugung stehen und nicht im Vorfeld jedes Analyseprozesses zusammengetragen werden mussen 2 Daher benotigen Data Lakes normalerweise viel mehr Speicherkapazitat als Data Warehouses Daruber hinaus sind unverarbeitete Rohdaten formbar lassen sich schnell fur die unterschiedlichsten Zwecke analysieren und sind ideal fur maschinelles Lernen Ein Datensumpf data swamp ist ein nicht verwalteter Data Lake der entweder fur die vorgesehenen Benutzer nicht zuganglich ist oder wenig Wert bietet Datensumpfe entstehen wenn keine angemessenen Datenqualitats und Data Governance Massnahmen durchgefuhrt werden Unterschiede zum Data Warehouse BearbeitenIm Data Warehouse Konzept werden bestimmte Daten nach dem ETL Schema aus den Quellsystemen extrahiert transformiert und in das zentrale Data Warehouse geladen Dagegen werden im Data Lake Konzept alle Daten aus den Quellsystemen geladen Es werden keine Daten abgewiesen Die Daten werden in einem nicht oder fast nicht transformierten Zustand gespeichert Erst zur Datenvisualisierung oder Datenanalyse werden die Daten aufbereitet 3 Der Vorteil der strukturiert auswertbaren Daten des Data Warehouses wird zu Gunsten einer hoheren Flexibilitat aufgegeben Die Anforderung an die Kenntnis der Datenstruktur steigen entsprechend 4 Einzelnachweise Bearbeiten Aufbau eines besseren Data Lake Abgerufen am 15 Januar 2021 Freiknecht Jonas Big Data in der Praxis Losungen mit Hadoop HBase und Hive Daten speichern aufbereiten visualisieren Hanser Munchen 2014 ISBN 978 3 446 43959 7 S 21 Chris Campbell Top Five Differences between Data Lakes and Data Warehouses Abgerufen am 20 Februar 2020 amerikanisches Englisch Data Lake vs Data Warehouse Wichtige Unterschiede Talend Abgerufen am 20 Februar 2020 Abgerufen von https de wikipedia org w index php title Data Lake amp oldid 230950157