www.wikidata.de-de.nina.az
Ein Data Warehouse kurz DWH oder DW wortlich Datenlager im Deutschen dominiert die englische Schreibweise die Schreibweise Datawarehouse wird jedoch auch verwendet ist eine fur Analysezwecke optimierte zentrale Datenbank die Daten aus mehreren in der Regel heterogenen Quellen zusammenfuhrt 1 Der Begriff stammt aus dem Informationsmanagement in der Wirtschaftsinformatik Vollstandige Daten zum Beispiel eines Unternehmens oder eines grosseren Projekts die in der Regel als Rohdaten vorliegen und nicht bereits nach bestimmten Vorgaben verarbeitet oder ausgewahlt wurden werden hingegen in Data Lakes vorgehalten Inhaltsverzeichnis 1 Begriff 2 Betrieb Data Warehousing 3 Anwendungen 4 Risiken 5 Literatur 6 EinzelnachweiseBegriff BearbeitenMitte der 1980er Jahre wurde bei IBM der Begriff information warehouse geschaffen Der Terminus data warehouse wurde erstmals 1988 von Barry Devlin verwendet 2 Es gibt derzeit keine einheitliche Definition fur den Begriff Data Warehouse Weitgehend gilt jedoch Ein Data Warehouse ermoglicht eine globale Sicht auf heterogene und verteilte Datenbestande indem die fur die globale Sicht relevanten Daten aus den Datenquellen zu einem gemeinsamen konsistenten Datenbestand zusammengefuhrt werden Dies ermoglicht einen komfortablen Datenzugriff 3 Der Inhalt eines Data Warehouse entsteht durch Kopieren und Aufbereiten von Daten aus unterschiedlichen Quellen Meist ist ein Data Warehouse die Basis fur die Aggregation von betrieblichen Kennzahlen und darauf aufbauende Analysen das sogenannte Online Analytical Processing OLAP Ein Data Warehouse ist haufig Ausgangsbasis fur Data Mining Oft arbeiten die Anwendungen mit anwendungsspezifisch erstellten Auszugen aus dem Data Warehouse den sogenannten Data Marts Unterschiede bei den Definitionen finden sich vor allem im generellen Zweck eines Data Warehouses sowie im Umfang und Umgang mit den Daten im Data Warehouse Das Spektrum der Definitionen beginnt mit der restriktiven Sicht von Bill Inmon Ein Data Warehouse ist eine themenorientierte integrierte chronologisierte und persistente Sammlung von Daten um das Management bei seinen Entscheidungsprozessen zu unterstutzen Im Original A data warehouse is a subject oriented integrated time variant nonvolatile collection of data in support of management s decision making process 4 Die Definition nach Inmon kann wie folgt interpretiert werden subject oriented Themenorientierung Die Auswahl der in das Data Warehouse zu ubernehmenden Daten geschieht nach bestimmten Datenobjekten Produkt Kunde Firma die fur die Analysen von Kennzahlen fur Entscheidungsprozesse relevant sind nicht hingegen nach operativen Prozessen integrated Vereinheitlichung Die in verschiedenen operativen Quellsystemen unterschiedlich strukturierten Daten werden im Data Warehouse in einheitlicher Form gespeichert time variant Zeitorientierung Analysen uber zeitliche Veranderungen und Entwicklungen sollen im Data Warehouse ermoglicht werden daher ist die langfristige Speicherung der Daten im Data Warehouse notig Einfuhrung der Dimension Zeit nonvolatile Bestandigkeit Daten werden dauerhaft nicht fluchtig gespeichert Die folgende Definitionen von Bauer und Gunzel 5 wie auch die von Kimball 6 sind weniger restriktiv sind aber auf einen speziellen Zweck die Analysefunktion ausgerichtet Ein Data Warehouse ist eine physische Datenbank die eine integrierte Sicht auf beliebige Daten darstellt um Analysen zu ermoglichen 5 A data warehouse is a copy of transaction data specifically structured for querying and reporting 6 Das Spektrum der Definitionen endet bei der Definition von Zeh die ohne Restriktionen an Umfang und Umgang der Daten sowie ohne Zweckbestimmung ist Ein Data Warehouse ist ein physischer Datenbestand der eine integrierte Sicht auf die zugrundeliegenden Datenquellen ermoglicht 7 Die Einschrankung physisch ist notwendig um das Data Warehouse von dem logischen foderierten Datenbanksystem abzugrenzen Betrieb Data Warehousing BearbeitenDer Erstellung eines Data Warehouses liegen zwei Leitgedanken zugrunde Integration von Daten aus verteilten und unterschiedlich strukturierten Datenbestanden um im Data Warehouse eine globale Sicht auf die Quelldaten und damit ubergreifende Auswertungen zu ermoglichen Separation der Daten die fur das operative Geschaft genutzt werden von solchen Daten die im Data Warehouse etwa fur Aufgaben des Berichtswesens der Entscheidungsunterstutzung der Geschaftsanalyse sowie des Controllings und der Unternehmensfuhrung verwendet werden Der Gesamtprozess der Datenbeschaffung Verwaltung und Auswertung eines Data Warehouses wird auch als Data Warehousing bezeichnet Zum Data Warehousing gehoren Datenbeschaffung Datenintegration Staging und Weiterverarbeitung im ETL Prozess Datenhaltung das heisst die langfristige Speicherung der Daten im Data Warehouse siehe auch Langzeitarchivierung Datenauswertung und analyse Versorgung und Datenhaltung der fur die Analyse notwendigen separaten Datenbestande den Data Marts In den Data Marts werden die Daten haufig als mehrdimensionale Matrizen im sogenannten Sternschema oder in verwandten Datenschemata wie Schneeflocken und Galaxy Schema abgelegt In den letzten Jahren hat sich mehr und mehr die Abkehr von der turnusmassigen Beladung hin zur Echtzeitbeladung des Data Warehouse vollzogen real time data warehousing Manche Branchen wie die Telekommunikationsindustrie und der Einzelhandel hatten Bedarf nach sofort verfugbaren Daten unter Wahrung der Trennung von operativen und auswertenden Systemen Real Time Data Warehousing ermoglicht zudem das unmittelbare Zuruckspielen der Ergebnisse in die operativen Systeme Damit beeinflussen Analyseergebnisse von Daten des Data Warehouse wiederum die das Data Warehouse speisenden operativen Systeme closed loop Anwendungen Bearbeiten nbsp Ausschnitt aus dem Data Warehouse SystemIntegration von Daten aus unterschiedlich strukturierten und verteilten Datenbestanden um eine globale Sicht auf die Quelldaten und damit ubergreifende Auswertungen zu ermoglichen Ermittlung verborgener Zusammenhange zwischen Daten durch Data Mining Schnelle und flexible Verfugbarkeit von Berichten Statistiken und Kennzahlen um etwa Zusammenhange zwischen Markt und Leistungsangebot erkennen zu konnen Umfassende Information uber Geschaftsobjekte und Zusammenhange Transparenz im Zeitablauf zu Geschaftsprozessen Kosten und Ressourceneinsatz Informationsbereitstellung zum Beispiel fur die Erstellung von Produktkatalogen Risiken BearbeitenDie 59 Konferenz der Datenschutzbeauftragten des Bundes und der Lander vom 14 15 Marz 2000 weist in ihrer Entschliessung zum Thema Data Warehouse Data Mining und Datenschutz auf das rechtliche Risiko hin das mit diesen Verfahren verbunden ist Insbesondere ist das Grundrecht auf informationelle Selbstbestimmung und fur den Schutz der Privatheit in Gefahr Grund ist die Moglichkeit der genannten Verfahren personenbezogene Daten uber ihre Zweckbindung hinaus zu speichern und zu nutzen was unter bestimmten Umstanden rechtswidrig ist Als Empfehlung gilt auf Techniken zu setzen die eine anonymisierte oder pseudonymisierte Form der ursprunglich personenbezogenen Form der Daten verwenden Literatur BearbeitenJan Holthuis Der Aufbau von Warehouse Systemen Konzept Datenmodellierung Vorgehen Deutscher Universitats Verlag ISBN 3 8244 6959 6 Ralph Hughes Agile Data Warehousing for the Enterprise Morgan Kaufmann Waltham Massachusetts 2015 ISBN 978 0 12 396518 9 Hans Hultgren Modeling the Agile Data Warehouse with Data Vault Brighton Hamilton Denver u a 2012 ISBN 978 0 615 72308 2 William H Inmon Richard D Hackathorn Using the Data Warehouse John Wiley amp Sons ISBN 0 471 05966 8 Reinhard Jung Robert Winter Data Warehousing Strategie Springer ISBN 3 540 67308 3 H G Kemper W Mehanna C Unger Business Intelligence Grundlagen und praktische Anwendung Vieweg ISBN 3 528 05802 1 Ralph Kimball Margy Ross The Data Warehouse Toolkit The Definitive Guide to Dimensional Modeling 3 Auflage Wiley New York 2013 ISBN 978 1 118 53080 1 Wolfgang Lehner Datenbanktechnologie fur Data Warehouse Systeme Konzepte und Methoden dpunkt ISBN 3 89864 177 5 Daniel Linstedt Michael Olschimke Building a Scalable Data Warehouse with Data Vault 2 0 Morgan Kaufmann Waltham Massachusetts 2016 ISBN 978 0 12 802510 9 Dani Schnider Claus Jordan u a Data Warehouse Blueprints Business Intelligence in der Praxis Hanser Munchen 2016 ISBN 978 3 446 45075 2 Reinhard Schutte Data Warehouse Managementhandbuch Konzepte Software Erfahrungen Springer ISBN 3 540 67561 2 J H Wieken Der Weg zum Data Warehouse Addison Wesley ISBN 978 3 8273 1560 1 Einzelnachweise Bearbeiten Erhard Rahm Data Warehouses PDF Einfuhrung S 2 abgerufen am 29 September 2015 Vorlesungsskript Universitat Leipzig Barry Devlin Data Warehouse From Architecture to Implementation Addison Wesley ISBN 0 201 96425 2 P Mertens et al Grundzuge der Wirtschaftsinformatik 5 Auflage Springer Verlag Berlin 1998 S 72 William H Inmon Building the Data Warehouse John Wiley amp Sons 1996 ISBN 978 0 471 14161 7 Seite 33 a b Andreas Bauer Holger Gunzel Data Warehouse Systeme Architektur Entwicklung Anwendung dpunkt 2013 ISBN 3 89864 785 4 a b Ralph Kimball Mary Ross The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling Wiley ISBN 0 471 20024 7 Thomas Zeh Data Warehousing als Organisationskonzept des Datenmanagements Eine kritische Betrachtung der Data Warehouse Definition von Inmon In Informatik Forschung und Entwicklung 18 Nr 1 2003 PDF Abgerufen von https de wikipedia org w index php title Data Warehouse amp oldid 236402293