Werden diese Umstände im Unternehmen nicht konsequent adressiert, kann daraus eine mangelnde Datenqualität resultieren. Diese kann Geschäftsprozesse negativ beeinflussen (z. B. falsche Zustellung von Artikeln) und führt zu einem erhöhten Verarbeitungsaufwand (Mitarbeiter müssen häufig prüfen und nachfragen). Zudem können Datenanalysen, auf denen wichtige strategische Entscheidungen beruhen, fehlerhaft sein.
Um solche Missstände zu umgehen, sind Maßnahmen erforderlich, die üblicherweise unter dem Begriff Data Governance zusammengefasst werden. Dazu gehören z. B.
- Benennung von Rollen bzw. Personen, die für die Aufrechterhaltung der Datenqualität zuständig sind.
- Etablierung fester Prozesse für die Datenpflege im Unternehmen, die die Datenqualität, den Datenschutz und die Datensicherheit adressieren.
- Anschaffung entsprechender Data-Governance-Software, die bei der Umsetzung der Maßnahmen unterstützt.
Technologien für das Datenmanagement
Zur Unterstützung des Datenmanagements im Unternehmen kann spezifische Datenqualitäts-Software in der Bearbeitung resultierender Aufgaben gezielt unterstützen. Auf dem Markt ist eine Vielzahl von Softwareanbietern aktiv, die in ihrem Fokus und Funktionsumfang von kleinen Tools zur Bereinigung einzelner Datensätze bis hin zu umfangreichen Server-Applikationen zum ganzheitlichen Datenmanagement von Konzernen reichen.
Je nach Anforderungsbedarf wird nach drei grundlegenden Software-Kategorien unterschieden: Stammdatenmanagement-Suite (MDM-Suite), Stammdaten-Integration (DI) und Stammdatenqualitäts-Management (DQ). Dabei können die Funktionen der Kategorien Stammdaten-Integration (DI) und Stammdatenqualitäts-Management (DQ) durchaus Bestandteil einer umfangreichen Stammdaten-Management-Suite sein. Es existieren aber auch eine Vielzahl von Stand-Alone-Lösungen für einzelne Aufgaben. Dazu kommt, dass unterschiedliche Funktionsumfänge den Vergleich einzelner Angebote und damit die Auswahl von Lösungen für das Stammdatenmanagement komplex machen.
Produkte in der Kategorie Datenintegration (DI) unterstützen die konsistente und fehlerfreie Verteilung der Stammdaten in voneinander isolierten Applikationen. Dies beseitigt Redundanzen und Inkonsistenzen der Stammdaten und beinhaltet drei Funktionsbereiche: Datenimport, Datentransformation und Datenexport.
Wie bereits oben erläutert, führt eine schlechte Datenqualität erfahrungsgemäß zu schrittweise ineffizienteren und ineffektiveren Prozessen durch erforderliche Rückfragen, Uneindeutigkeiten und Missverständnisse. Zum Beispiel entstehen bei fehlerhaften Kundenstammdaten aufgrund der Rückläufer und Fehlsendungen Kosten und Image-Verlust.
Produkte in der Kategorie Datenqualität (DQ) unterstützen die Schaffung und Sicherung einer angemessenen Qualität. Dies steigert die Verlässlichkeit und Nutzbarkeit der Stammdaten und beinhaltet drei Funktionsbereiche: Datenanalyse, Datenanreicherung und Datenbereinigung. Der Funktionsbereich Datenanalyse beinhaltet Funktionen zur Identifikation von Problemen im Stammdatenbestand. Bei der Datenanreicherung versucht man eine Datenqualitätsverbesserung der eigenen Stammdaten durch Vergleich und Übernahmen externer Referenzdaten oder das Verknüpfen von bspw. Bildern zu erreichen. Bei der Analyse erkannte Datendefekte können durch Funktionen aus dem Bereich der Datenbereinigung gemindert oder geheilt werden.
Produkte in der Kategorie Stammdatenmanagement (MDM) unterstützen schließlich die Verwaltung im Rahmen des Lebenszyklus der Stammdatenobjekte und beinhalten die Funktionsbereiche Stammdatenanlage, Stammdatenpflege und Stammdatendeaktivierung. Die korrekte und strukturierte Erfassung und Anlage von Stammdaten sowie die Verteilung auf die verschiedenen Zielsysteme (z. B. unterschiedliche ERP-Systeme in Regionalgesellschaften) wird durch MDM-Suiten im Funktionsbereich Stammdatenanlage unterstützt. Die Stammdaten-pflege umfasst die Unterstützung des Anwenders bei der Veränderung von Daten inklusive der gesamten zugehörigen Geschäftslogik. So müssen alle Transaktionen, die sich auf veränderte Attribute beziehen, ebenfalls angepasst werden. Im Rahmen der Stammdatendeaktivierung wird die sukzessive Sperrung, Löschung und Archivierung von Stammdatenobjekten gesteuert. Der Umfang reicht dabei von einer Deaktivierung einer Dublette über die Deaktivierung, weil ein Datenobjekt nicht mehr real existiert, bis hin zur sofortigen Deaktivierung aufgrund rechtlicher, finanzieller oder personengefährdender Gründe.
Datenintegration
Im betrieblichen Umfeld verteilen sich Daten in der Regel auf mehrere verschiedenen Quellen, innerhalb eines Unternehmensstandorts z. B. auf verschiedene Systeme (ERP, CRM usw.) und darunterliegende Datenbanken, fast immer aber auch auf Office-Dokumente oder auf die Köpfe der Mitarbeiter. Verschiedene Standorte können wiederum unterschiedliche Systeme einsetzen, ebenso überbetrieblich z. B. Lieferanten des Unternehmens.
Oft ist es notwendig, diese Daten zusammenzuführen, um Geschäftsprozesse zu steuern oder Datenanalysen für strategische Entscheidungen zu erstellen. Aufgrund der verschiedenen Formate der Systeme und Datenquellen ist dies eine herausfordernde Aufgabe, die jedoch gemeistert werden muss, um nicht wertvolle Informationen und Zusammenhänge zwischen diesen brach liegen zu lassen. Manchmal ist eine solche Datenintegration nur eine singuläre Aufgabe, z. B. bei einer Datenmigration auf ein neues System, das bisher getrennte Informationsquellen zusammenfasst. Oft ist jedoch eine fortwährende Integration sich verändernder Datenbestände notwendig, die sich z. B. in isolierten Applikationen bzw. Datenquellen befinden. Wie bereits im vorigen Abschnitt beschrieben, ist das Ziel hierbei die Beseitigung von Redundanzen und Inkonsistenzen in den Daten und umfasst die Funktionsbereiche Datenimport, Datentransformation und Datenexport.
Insbesondere für komplexe Auswertungen, die strategische Entscheidungen unterstützen sollen, werden Daten aus verschiedenen Quellen häufig in einem sog. Data Warehouse zusammengefasst. In regelmäßigen Abständen werden hierbei Daten aus den Produktivdatenbanken in das Data Warehouse migriert, wo dann „offline“ Datenanalysen (zur Bestimmung bestimmter Kennzahlen) und Data Mining (zum Finden „versteckter“ Zusammenhänge) betrieben werden.
Einsatz von künstlicher Intelligenz
Sehr häufig lassen Methoden der künstlichen Intelligenz eine Optimierung der Geschäftsprozesse und ein Ermitteln hilfreicher Zusammenhänge für Unternehmensentscheidungen zu, die auf konventionellem Wege nicht zu erreichen wären. Dahinter stecken in der Regel komplexe Algorithmen und Verfahren, die alle verfügbaren Unternehmensdaten betrachten und nach verschiedenen Kriterien in Beziehung miteinander setzen. Eine sehr große Rolle spielt hier vor dem eigentlichen Einsatz die Aufbereitung der Daten, da Fehler oder fehlende Informationen in den Ausgangsdaten zu deutlichen Abweichungen in den Ergebnissen führen können.
Eine Untersuchung, ob Methoden der künstlichen Intelligenz für ein Unternehmen gewinnbringend eingesetzt werden können, kann in der Regel nur von speziellen KI-Experten durchgeführt werden, die die Sammlung und Aufbereitung der relevanten Daten organisieren, dann geeignete Algorithmen auf diese ansetzen und die Ergebnisse am Ende interpretieren. Werden bei einer solchen Untersuchung dann entsprechende Potentiale entdeckt, kann innerhalb eines gesonderten Implementierungsprojektes eine KI-Lösung im Unternehmen etabliert werden.