Mehr Daten bedeuten nicht automatisch mehr Überblick. Im Gegenteil: Trotzdem stellen Unternehmen viel zu selten ihre Datensammelwut und die Validität der zusammengetragenen Informationen infrage. Welchen Wert aber können vermeintlich richtungsweisende Entscheidung haben, deren Grundlage fragwürdige oder verunreinigte Quellen darstellen?
Egal ob veraltet, doppelt registriert oder schlicht unvollständig – die Gründe für schlechte Qualität von Informationen sind vielseitig. Dabei betrifft das Problem Dirty Data besonders Unternehmen, die große Mengen an Daten erfassen. „Sticht das Chaos bereits ins Auge, ist der Frühlingsputz mehr als überfällig“, weiß Andreas Köninger, Digitalisierungsexperte und Vorstand der SinkaCom AG. „Schließlich fällt die Bereinigung immer schwerer, je reicher die Speicher gefüllt sind.“ Glücklicherweise können Maßnahmen auf struktureller Ebene die Datenhygiene immens verbessern und so für zuverlässiges Reporting sorgen.
Mit Sinn und Verstand
Entgegen der landläufigen Annahme hilft in Sachen Datenhaushalt viel nicht immer viel. Im Gegenteil: Sammelwut ist eher kontraproduktiv. „In der Praxis zeigt sich diesbezüglich regelmäßig, dass neben der Komplexität auch Aufwände und Kosten exponentiell steigen, während die Datenqualität in noch stärkerem Maße fällt“, betont Andreas Köninger.
Als ersten Schritt zur Verbesserung der Lage gilt es daher die eigenen Prozesse zu hinterfragen. Welches Ziel wird mit dem Sammeln der Informationen verfolgt? Fördern sie die Optimierung von Abläufen? Lassen sich Kennzahlen aus dem Wissen ableiten? Besitzen Daten keine Relevanz, lohnt sich eine Löschung, um das Dickicht auszudünnen. Ein solches Vorgehen entspricht dann auch dem DSGVO-Grundsatz der Datensparsamkeit. „Um im nächsten Schritt eine effektive Analyse zu ermöglichen, braucht es eine Form von Kompatibilität zwischen allen verwendeten Datenformaten“, weiß Andreas Köninger. „Das beginnt bei einer einheitlichen Unternehmenssprache und hört bei einer vollautomatisierten Umwandlung der Informationen auf.“
Denn nur wenn alle Abteilungen beispielsweise dieselbe Bezeichnung für einen Geschäftsprozess oder Kunden verwenden, lassen sich Unreinheiten wie doppelte Einträge überhaupt erkennen. So können etwa unterschiedliche Bezeichnungen wie „Geschäftsführer“ und „Vorsitzender der Geschäftsführung“ den Maschinen mehrere Posten suggerieren, obwohl es sich um dieselbe Stelle handelt. Im Zweifelsfall unterstützen eigenständige Anwendungen bei der Übertragung der Informationen in das gewünschte Format und bereinigen Ungenauigkeiten automatisch. Besonders wenn von externen Partnern regelmäßig Übertragungen eintreffen, reduziert ein spezialisiertes Programm oder eine gut konzipierte Schnittstelle das Potenzial für Dirty Data. Gelingt es, alle relevanten Informationen abteilungsübergreifend zu vereinheitlichen und somit auslesbar zu machen, ist ein großer Schritt getan.
Überblick schaffen
Einmalig Kompatibilität herzustellen reicht allerdings nicht. In den Schnittstellen und Datenhaushalten müssen Regelwerke zur Standardisierung und Normierung samt der zum Zeitpunkt der Datengewinnung geltenden Konventionen auf unterster Ebene mit implementiert werden, um langfristig eine geeignete Datenqualität sicherzustellen. Die größte Aufgabe nach der Vereinheitlichung ist es, dauerhaft Kontrolle über die Formate zu behalten. „Viele Unternehmen neigen dazu, einzelne Datensilos anzulegen, auf die nur geringe Teile der Belegschaft und Maschinen zugreifen können. Dadurch prägen sich häufig eigene Bezeichnungen und Umsetzungen aus und die Gefahr, dass bereits kompatible Informationen in den Speichern verschwinden und wieder verunreinigt werden, wächst“, berichtet Andreas Köninger.
Eine zentrale Datenbank beugt solchen Fehlentwicklungen vor, denn sie erleichtert eine einheitliche Pflege. Außerdem liefert ein solch zentralisierter Aufbau, etwa in Kombination mit einem ERP-System, den Grundstock für eine dichte, unternehmensweite Optimierung von Abläufen. Ergänzend dazu helfen Datenbeauftragte, deren Aufgabe darin besteht, klar nachvollziehbaren Informationsfluss in bestimmten Abteilungen oder Geschäftsprozessen zu gewährleisten. Dieser Schritt schafft nicht nur ein verlässliches Netz an Ansprechpartnern, sondern lenkt auch den Austausch in beherrschbare Bahnen und schafft die Grundlage für Big-Data-Analysen sowie für die Weiterentwicklung von datengestützten und -getriggerten Geschäftsprozessen oder -modellen. Präventiv hingegen wirkt die Schulung von Mitarbeitern, die nur selten ahnen, welche umfassenden Nebenwirkungen bereits kleine Verunreinigungen auf die Abläufe im Unternehmen erzeugen. Für den Experten steht dabei fest, dass insgesamt die Maxime gelten sollte: „Schlanke Strukturen wirken Wunder gegen Dirty Data.“