DGQ-Glossar Digitalisierung: Data Lake19 | 11 | 19

Viele Konzerne sind auf die Erhebung und Auswertung von Big Data angewiesen, um Produkte und Dienstleistungen erfolgreich bewerben und verkaufen zu können. Big Data aber sind besonders schnelllebige Massedaten, die weltweit im Sekundentakt durch jede Aktion und Interaktion im Internet generiert werden. Unternehmen, die an der Auswertung von Big Data interessiert sind, brauchen eine Möglichkeit, diese Masse an Daten in unveränderter Rohform zu speichern. Data Lakes (auch Datenseen genannt) sind Datenspeicher, die die massenhafte Speicherung von generierten Big Data im Ursprungsformat erlauben.

Die Daten müssen dabei nicht strukturiert sein und können entweder auf einer Text- oder Zahlengrundlage oder als rohe Video- und Bilddateien gespeichert werden. Sobald die Analyse und Auswertung bestimmter Daten aus dem Datensee erfolgen soll, können Anwender gezielt auf gespeicherte Daten zugreifen.

Der größte Vorteil von Datenseen ist, dass gesammelte Daten nicht wie in der unternehmerischen Praxis oft üblich auf vereinzelten Computern und Festplatten in dezentralen Datensilos liegen, wo sie unzugänglich für andere Nutzer sind. Stattdessen werden Daten im zentral zugänglichen Data Lake vorgehalten und können jederzeit und je nach tatsächlichem Bedarf von Nutzern ausgewertet, strukturiert und formatiert werden. Da Daten im Data Lake im ursprünglichen Rohformat gespeichert werden, erfordern Speicherprozesse keine große Rechenleistung.

Als Möglichkeit zur massenhaften Datenspeicherung sind Data Lakes ähnlich den sogenannten Data Warehouses. Auch im Datenwarenhaus werden große Mengen Daten gespeichert und zur Auswertung vorgehalten. Der größte Unterschied ist aber, dass ein Data Warehouse gespeicherte Daten aus unterschiedlichen Quellen automatisch in auswertungsfertigen Formaten und Strukturen speichert. So überführt das Data Warehouse Daten direkt in für unterschiedliche Nutzer sofort verwertbare Formate. Daten im Data Lake werden hingegen weder strukturiert noch kategorisiert oder formatiert.

Über den Autor: DGQ

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert