Ungenutzt, jedoch nicht zu ignorieren

So können Unternehmen Dark Data erkennen und Ihre Effizienz steigern

Daten sind der zentrale Treibstoff für den Geschäftserfolg in allen Branchen weltweit. Daher scheint es paradox, dass viele Unternehmen nicht wissen, was auf ihren Servern lagert.

Laut Gartner besteht ein Großteil des Informationsuniversums von Unternehmen aus „Dark Data“. Wie bei einem Eisberg ist oft nur die Spitze der Datenmasse sichtbar, der überwiegende Teil liegt als Dark Data unter der Oberfläche verborgen. Diese ungenutzten Daten – seien es Informationen, die routinemäßig im Rahmen der Geschäftsabwicklung durch Mitarbeiter*innen, Kund*innen und Geschäftsprozesse sowie durch Maschinen, Anwendungen und Sicherheitssysteme generiert werden – nehmen enorme Mengen an Platz in Rechenzentren ein.

Anzeige

Jedes Unternehmen ist betroffen

Keine Organisation bleibt von Dark Data unberührt. Je nach Sektor werden zwischen 40 und 90 Prozent Dark Data von Firmen unbemerkt mitverwaltet und bleiben im Allgemeinen ungenutzt. Laut Weltwirtschaftsforum erzeugen Unternehmen täglich 1,3 Billionen Gigabyte an Dunklen Daten. Diese beanspruchen Serverplatz, verbrauchen Energie und verursachen Kosten. Werden keine erneuerbaren Energien zum Betrieb der Server zur Speicherung verwendet, wird zusätzlich eine beträchtliche Menge an Emissionen ausgestoßen: Das Speichern von Dark Data für ein Jahr erzeugt in diesem Fall so viel CO2 wie drei Millionen Flüge von London nach New York. Da Dark Data in der Regel unstrukturiert und nicht gesichtet sind, resultieren außerdem diverse Datenschutz- und Compliance-Risiken für Unternehmen.

Der Daten-Eisberg wächst: Mangelnde Strukturierungsprozesse und Komplexität

Wie ist es möglich, dass Unternehmen eine derart große Menge an Dark Data anhäufen? In vielen Organisationen ist das Ausmaß von Dark Data ein Ausdruck ihrer mangelnden Datenstrukturierungsprozesse: Die Fähigkeit einer Firma, Daten zu sammeln, kann die Durchsatzrate, mit der sie Daten analysieren kann, überschreiten. In einigen Fällen ist sich das Unternehmen nicht einmal bewusst, dass Daten gesammelt werden.

Laut IBM verlieren 60 % der Daten ihren Wert innerhalb von Millisekunden nach der Erfassung. Organisationen behalten Dark Data dennoch aus diversen Gründen, beispielsweise aufgrund gesetzlicher Einhaltungs-, Aufzeichnungs- und Aufbewahrungspflichten. Oftmals ist allerdings die Komplexität von Datenschutz, Compliance und Data Discovery ausschlaggebend dafür, dass Unternehmen große Mengen an Daten ansammeln, ohne sie angemessen zu organisieren. Einige Unternehmen glauben, dass Dark Data in Zukunft nützlich sein könnten – nämlich dann, wenn sie bessere Analyse- und Business-Intelligence-Technologien zur Verarbeitung der gesammelten Informationen erworben haben.

Anzeige
Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Automatisierte Datenstrukturierung mit Hilfe von KI

Während die Bewältigung dieses Daten-Eisbergs im ersten Moment auf Verantwortliche entmutigend erscheint, so gibt es gute Nachrichten: KI und maschinelles Lernen können mittlerweile effektiv dabei unterstützten, den Prozess der Datenstrukturierung zu automatisieren. Um diesen in Gang zu setzen, überprüfen Mitarbeitende zu Beginn lediglich einen kleinen Prozentsatz an Dark Data. Im Anschluss wird ein Reinforcement-Learning-Modell eingesetzt, um die Relevanz der verbleibenden Daten zu bewerten und diese zu priorisieren. Nach diesem Schritt erleichtert die kontinuierliche Analyse und entsprechendes Tagging die Verwaltung dieses Strukturierungsprozesses. Dabei ist zu beachten, dass diese nun strukturierten Dark Data nicht automatisch für eine weitere Aufbewahrung sinnvoll sind. Manche sind überflüssig, veraltet und irrelevant oder von Natur aus nutzlos. Nichtsdestotrotz lassen sich strukturierte Daten leichter verfolgen, separieren und letztendlich bei Bedarf löschen.

Benchmark für die effektive Datennutzung

Woran können Unternehmen messen, wie effektiv sie ihre Daten nutzen? Neben bestehenden Metriken zur Messung von Effizienz und Nachhaltigkeit, wie dem CUE (Carbon Usage Effecitveness), WUE (Water Usage Effectiveness) oder PUE (Power Usage Effectiveness), sollten Unternehmen darüber nachdenken, eine weitere Kennzahl einzuführen: Die Data Usage Effectiveness (DUE) misst anhand einer Skala die tatsächliche Effektivität der Datennutzung in Organisationen – eine 1 wäre zum Beispiel eine 100%ige Eliminierung nicht-wesentlicher Einwegdaten. Ein solcher Benchmark setzt einen Standard, bewertet den Fortschritt des Prozesses und kann als digitaler Leistungsindikator wertvoll sein. Sinnvoll ist eine solche Messung aber erst, wenn ein grundlegender Überblick über die Dark Data besteht.

Dark Data suchen, finden und nutzen

Für Unternehmen gilt es, Dark Data unter der Oberfläche des Daten-Eisberges zu identifizieren und die Effizienz ihrer Datennutzung zu steigern. Der Schlüssel für die erfolgreiche Handhabung von Daten besteht in einem intelligenten Datenmanagement über den gesamten analogen und digitalen Datenlebenszyklus hinweg. Es gilt also, Daten auf Verwendungsmöglichkeiten zu bewerten und unnütze Daten direkt zu Beginn zu identifizieren, zu strukturieren und nachverfolgbar zu kategorisieren. Sobald sämtliche vorhandenen Daten sichtbar gemacht sind, ist es Unternehmen möglich, die Menge an überflüssigen Dark Data zu reduzieren.

Während Standards zur Nutzung von Daten von einzelnen Unternehmen eingeführt werden müssen, können erfahrene Betreiber von Datenzentren hier wichtige Partner sein – von der Verwahrung von Daten bis hin zur KI-unterstützten Identifikation und Verarbeitung von Dark Data.

So gelingt es, die wichtigen Daten für den Unternehmenserfolg, sinnvoll und effektiv zu verwalten. Gleichzeitig können Unternehmen so ökologische und finanzielle Belastungen, die durch übermäßige Datenspeicherung entstehen, reduzieren.

Ralf Reich

Ralf

Reich

Commercial Vice President Northern Europe

Iron Mountain

Ralf Reich ist bei Iron Mountain für die strategische kaufmännische Leitung in DACH, Nordics und Polen verantwortlich und hat über 30 Jahre Erfahrung in der IT-Branche. Seine Karriere begann er bei IBM und Hewlett-Packard in den Bereichen IT-Services und strategisches Outsourcing. Später wechselte er zu Wipro und Softserve.
Anzeige

Artikel zu diesem Thema

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.