II. Daten-Rollen
1. Data Engineer
Was macht ein Data Engineer?
Daten-Engineering ist die Praxis der Bereitstellung geeigneter Daten für verschiedene Datenkonsumenten (einschließlich Data Scientists, Daten- und Geschäftsanalysten, Citizen Integrator und Geschäftskunden). Ein Citizen Integrator ist ein Endbenutzer, der ohne tiefgreifende Kenntnisse von Programmiersprachen Software entwickeln kann. Der Fokus liegt dabei auf der Integration zwischen Front-End und Back-End oder verschiedenen Applikationen.
Es handelt sich also um eine Disziplin, die die Zusammenarbeit zwischen Geschäfts- und IT-Einheiten. Diese Schlüsseldisziplin erfordert qualifizierte Mitarbeiter, oft Dateningenieure, die sowohl die IT- als auch die Geschäftsteams unterstützen. Sie sind in erster Linie für den Aufbau, das Management und die Operationalisierung von Datenpipelines zur Unterstützung der wichtigsten D&A-Anwendungsfälle zuständig. Sie sind auch verantwortlich für die Leitung die mühsame (und oft komplexe) Aufgabe der:
- Kuratierung von Datensätzen und Datenpipelines, die von nicht-technischen Anwendern (etwa durch Self-Service-Datenaufbereitungstools), Datenwissenschaftlern oder sogar IT-Ressourcen erstellt wurden.
- Operationalisierung der Datenbereitstellung für Einsätze auf Produktionsebene.
Schließlich unterstützen sie die wichtige Aufgabe der Bereitstellung von Analysen und Data-Science-Ergebnissen in bestehenden Geschäftsprozessen und Anwendungen.
Data Engineers gewährleisten auch die Einhaltung von Data Governance und Datensicherheitsanforderungen. Sie sind geschäftskritisch, da sie wissen, wo sie mit den Daten beginnen müssen und welche Pipelines geschäftsorientiert sind. Daher müssen sie mit dem Unternehmen zusammenarbeiten und die Organisation über Data Engineering aufklären, damit die Benutzer es selbständig durchführen können. Sie müssen verschiedene technische und betriebswirtschaftliche Fähigkeiten mitbringen, wie etwa:
- Arbeiten mit verschiedenen Datensätzen
- Analysieren und Verstehen von Daten
- Zusammenarbeit mit Fachexperten, Datenwissenschaftlern und Analysten bei der Formulierung der geschäftlichen Probleme
- Schnelle Bereitstellung von integrierten Daten über mehrere Umgebungen hinweg
Von Dateningenieuren wird zudem erwartet, dass sie teamfähig sind und als „Datengurus” fungieren, um das Unternehmen bei der Integration von Analysen und Data-Science-Modellen in die Geschäftsprozesse und die Interpretation der Ergebnisse zu unterstützen. Dieser Bedarf hat zu einer Untergruppe von Dateningenieuren geführt, die als „Analytik-Ingenieure” bezeichnet werden.
2. Analytics Engineer
Was macht ein Analytics Engineer?
Der Analytics Engineer ist dem Data Engineer ähnlich, konzentriert sich aber auf andere Pipelines. Der traditionelle Data Engineer konzentriert sich auf die Entwicklung von Datenpipelines von operativen/transaktionalen Quellen zum Unternehmensdaten-Repository. Im Gegensatz dazu konzentriert sich der Analysetechniker auf die Entwicklung von Datenpipelines für KI/ML-Modelle und Data-Science-Teams. Analytics Engineers bereiten Datenpipelines vor, die Datensätze für analytische Zwecke erstellen, einschließlich Datensätze für Endbenutzer zum Import in Desktop-Tools und Datensätze für BI-Entwickler zum Importieren in ABI-Tools. Zusätzlich zu den regionalen und lokalen Datenquellen verwendet der Analytikingenieur den „kuratierten” Bereich des Unternehmensdaten-Repository als Quelle für diese Art von Datenprodukten.
Ohne Dateningenieure sind D&A-Initiativen anfälliger für zusätzliche Kosten, Verzögerungen bei der Bereitstellung sowie Problemen bei der Datenintegration, -qualität und -verfügbarkeit.
3. Data Steward
Was macht ein Data Steward?
Ein Data Steward ist in der Regel eine Person innerhalb einer Unternehmensgruppe, die für alle Fragen bzw. Unstimmigkeiten in den Datenquellen zu Verfügung steht. Wenn die Datenverantwortlichen im Unternehmen weit verstreut sind (entlang von Abteilungs-/Funktionslinien oder Geschäftsprozesslinien), besteht ein Bedarf an Stewardship-Aktivitäten in puncto Koordination, um Konsistenz und Nutzen zu erzielen.
Der leitende Data Steward treibt diese Koordination voran, indem er Prozesse einführt, die regeln, wie andere Stewards vorgehen:
- ihre Aktivitäten zur Durchsetzung der Richtlinien durchführen
- die Kommunikation ihrer Maßnahmen an die Kollegen
- die Eskalation von Problemen und Vorschlägen an das Information Governance Board
Die Rolle des Datenverwalters konzentriert sich auf die Durchsetzung der D&A-Governance-Richtlinien, die vom D&A-Governance-Board erstellt wurden. In der Praxis ist der Steward für die Umsetzung der D&A-Governance-Richtlinien und die Überwachung der Informationsressourcen und Personen im Hinblick auf diese Richtlinien verantwortlich. Wenn Abweichungen von den Richtlinien festgestellt werden und diese nicht durch automatisierte Mittel gelöst werden können, ist der Steward die zentrale Anlaufstelle für die Problemlösung.
3. MDM Manager
Was macht ein MDM Manager?
Unternehmen unterscheiden sich in der Art und Weise, wie sie Master Data Management (MDM) organisieren, aufgrund von großen Unterschieden in Umfang, Komplexität, Struktur und dem Grad der Zentralisierung und Lokalisierung. Dennoch können einige grundlegende Organisationsprinzipien als Best Practices für einen größeren Erfolg beschrieben werden. Diese umfassen:
– Executive-Sponsoring, um eine gemeinsame Version der Wahrheit voranzutreiben
– Unterstützung für unternehmensweite Informationsverwaltung zur Erstellung und Durchsetzung von Informationsmanagementrichtlinien
Der MDM-Manager stellt sicher, dass Änderungen in der Organisation und der Geschäftsausrichtung, die sich auf das MDM-Programm auswirken, entweder von einem zentralen Team oder innerhalb der Geschäftseinheiten, funktionalen Bereichen oder geografischen Gebieten beurteilt und umgesetzt werden.
Verantwortlichkeiten von MDM-Managern umfassen:
- Definition einer MDM-Vision
- Ausrichtung des Umfangs der einzelnen Phasen des MDM-Programms an der Enterprise Information Management (EIM)-Strategie
- Identifizierung von Geschäftsszenarien für jede Phase des MDM-Programms, für die sie einen Business Case entwickeln
- Identifizierung der wichtigsten Geschäftsprozesse, die von dem MDM-Programm betroffen sein werden
Der MDM-Manager arbeitet mit der IT-Abteilung in den Bereichen Architektur, Datenmodellierung, Integration, Anwendungsentwicklung, Datenqualitätstechnologien, Systemmanagement, Sicherheit und Berichterstattung zusammen.
4. Data Modeler
Was macht ein Data Modeler?
Die Datenmodellierung dient dazu, die Arten von Informationen zu beschreiben, die für ein Unternehmen wichtig sind. Data Modeler erstellen vom Benutzer genehmigte Datenmodelle, arbeiten mit dem D&A-Architekten dem „Eigentümer/Owner” des Datenmodells zusammen und entwickeln Geschäftsdatenglossare und Ontologien.
Sie tun dies, um die Datenqualität, den Datenschutz und die Datensicherheit, die Datenabfolge und die Integration, Data Governance, Laufzeitmodelle und Datenbankschemata zu unterstützen – alles, um einen unternehmensweiten Konsens über die Bedeutung der Daten zu erzielen. Der Datenmodellierer tauscht sich mit mehreren Fachexperten, von so vielen Abteilungen und Benutzergruppen wie nötig aus und modelliert Geschäftsanforderungen einschließlich der Konsistenz und der Koordination.
III. Analytics-Rollen
1. Analytics and Business Intelligence Developer (ABI Developer)
Was macht ein Analytics and Business Intelligence Developer?
ABI-Entwickler pflegen enge Beziehungen zu Geschäftspartnern, um eine analytische und technische Unterstützung für Analyse- und Business Intelligence-Aktivitäten zu leisten. Sie entwickeln Berichte, Dashboards und interaktive Visualisierungen und arbeiten mit Data Warehouses, Datenintegration und Datenmodellierung zusammen, um Geschäftsentscheidungen zu unterstützen.
2. Data Scientist/Datenwissenschaftler
Was macht ein Data Scientist?
Der Data Scientist ist verantwortlich für die Modellierung komplexer Geschäftsprobleme und Geschäftseinblicke mit Hilfe quantitativer Disziplinen (Statistik, Algorithmik und Mining) und Visualisierungstechniken. Datenwissenschaftler verfügen in der Regel über einen höheren Abschluss in Informatik, Statistik, Wirtschaft oder verwandten Bereichen.
Datenwissenschaftler tragen zum Aufbau und zur Entwicklung der Dateninfrastruktur des Unternehmens bei und unterstützen die Organisation mit Erkenntnissen und Analysen für Entscheidungsprozesse. Data Scientists verwenden häufig Vorhersagen (Predictive Analytics) oder stufen Situationen ein und entwickeln Next-Best-Action-Modelle (Prescriptive Analytics).
Die Rolle des Datenwissenschaftlers kann in verschiedenen Varianten ausgeübt werden etwa als Chief Data Scientist und Citizen Data Scientist. Das Konzept des Citizen Data Scientists wurde bereits im Jahr 2016 von Gartner theorisiert und beschreibt einen Business User, welcher unternehmerisches Fachwissen und Expertise im Bereich Data Science vereint, ohne dabei tiefere mathematische oder statistische Kenntnisse aufzuweisen.
3. Chief Data Scientist
Was macht ein Chief Data Scientist?
Die Rolle des Chief Data Scientist gewinnt zunehmend an Bedeutung. Er arbeitet mit dem Chief Data and Analytics Officer zusammen. Das heißt, die eine Rolle ersetzt nicht die andere. Eine separate Rolle mit Schwerpunkt Datenwissenschaft ist für Unternehmen, die mit der zunehmenden Komplexität und der Verbreitung von KI konfrontiert sind, heute fast obligatorisch.
4. Citizen Data Scientist oder „Jedermanns Datenwissenschaftler“
Was macht ein Citizen Data Scientist?
Citizen Data Scientists sind oft Business User, die keine formale Ausbildung als Datenwissenschaftler haben, aber dennoch eine Vielzahl von Data-Science-Aufgaben durchführen können. Dies gelingt ihnen durch die Unterstützung erweiterter Analysewerkzeuge für die Datenvorbereitung, Datenermittlung, Modellentwicklung und -einsatz. Citizen Data Scientists besitzen die Fähigkeit, ihr analytisches Fachwissen zu erweitern und ihren Geschäftssinn einzusetzen, um fortschrittliche Erkenntnisse zu gewinnen, wobei sie eng mit führenden Datenwissenschaftlern zusammenarbeiten, die oft im D&A-Kompetenzzentrum sitzen.
5. Entwickler für KI/ML
Was macht ein KI/ML-Entwickler?
KI/ML-Entwickler sind zunehmend verantwortlich für die Anreicherung verschiedener Anwendungen mit maschinellem Lernen oder anderen KI-Fähigkeiten, wie der Verarbeitung natürlicher Sprache, Bilderkennung oder Optimierung. Sie sollten in der Lage sein, KI-Modelle einzubinden, zu integrieren und einzusetzen:
– entwickelt von Datenwissenschaftlern oder anderen KI-Experten
– angeboten von Cloud- und anderen Dienstanbietern
– selbst entwickelt durch erweitertes maschinelles Lernen
Darüber hinaus sollten KI/ML-Entwickler in der Lage sein, Daten zu sammeln und aufzubereiten, die als Input für Daten als Input für die Modellschulung und -ausführung zu sammeln und aufzubereiten, entweder selbst oder in Zusammenarbeit mit Ingenieuren.
Zu den Schlüsselkompetenzen gehören die Fähigkeiten und das technische Fachwissen, die für die Integration und Bereitstellung nötig sind, wie zum Beispiel API-Verwaltung und Containerisierung. Weitere wichtige Fähigkeiten betreffen die Identifizierung und Verbindung von Datenbeständen, die Datenqualität, die Datenaufbereitung und die Datenintegration. KI/ML-Entwickler müssen wissen, wie sie diese Datenkenntnisse für die Modellierung, Training und Ausführung anwenden können. Um potenzielle Anwendungsfälle zu identifizieren, benötigen sie außerdem zumindest Grundkenntnisse über die Funktionsweise, die Vor- und Nachteile des maschinellen Lernens und anderer KI-Techniken, wie Clustering, Regression, Entscheidungsbäume, Deep Learning und andere Neuronale Netze.
6. Analytics Steward
Was macht ein Analytics Steward?
Diese Rolle ist der des Data Stewards ähnlich. Die Arbeit selbst findet jedoch in einem anderen Teil der D&A-Pipeline statt, und auch der Schwerpunkt ist ein anderer. Während der Data Steward in der Geschäftsleitung tätig ist und die Datenpolitik durchsetzt, arbeitet der Analytics Steward nachgelagert im Analyse-, BI- und Data Science-Team und trägt dazu bei, dass die D&A Richtlinien dort durchgesetzt werden.
Diese Durchsetzung der Richtlinien umfasst unter anderem Folgendes:
- eingehende Daten werden in die Analyseinfrastruktur eingespeist
- Modellzugang und -entwicklung
- Verteilung und Zugriff auf Berichte und Erkenntnisse
Wie bei der Datenverwaltung handelt es sich bei der Verwaltung von Analysen um eine Rolle, nicht um eine Vollzeitstelle. Analytik Stewards arbeiten auf dieselbe Weise wie Data Stewards und eskalieren Probleme bei Bedarf an das D&A Governance Board.