KI braucht intelligentes Datenmanagement

Künstliche Intelligenz (KI) verändert nicht nur die Produktions- und Arbeitswelt in den Unternehmen, sondern auch die Art und Weise, wie nationale Sicherheitsorganisationen weltweit ihre Operationen durchführen und Aktivitäten steuern. 

Deutschland setzt mit dem Projekt Polizei 2020 zunächst auf Datenintegration: Alle verfügbaren Daten von Bund und Länder sollen in einem gemeinsamen Datenhaus gebündelt werden, um die Arbeit der Polizei schneller und effizienter zu machen.

Anzeige

Das Projekt Polizei 2020 ist ein gutes Beispiel dafür, wie Sicherheitsbehörden das Potenzial von KI nutzen können. Durch die Schaffung einer einheitlichen Informationsarchitektur für die Polizeien des Bundes und der Länder soll das polizeiliche Informationswesen zentral koordiniert werden. Bislang basiert deren Informationsarchitektur auf einer Vielzahl unterschiedlicher Datentöpfe, die kaum miteinander verbunden sind. Eine zersplitterte IT-Landschaft, die von Eigenentwicklungen, Sonderlösungen, Schnittstellen, unterschiedlichen Dateiformaten und Erhebungsregeln geprägt ist, genügt nicht mehr den Anforderungen an eine moderne Polizeiarbeit. Das BKA wird als Zentralstelle für das neue Datenhaus allen Beteiligten Informationen, Serviceleistungen und Know-how zur Verfügung stellen. Die Grundlage dafür können nur saubere, verlässliche Daten sein. Als Kernziele wurden eine bessere Verfügbarkeit polizeilicher Informationen, die Erhöhung der Wirtschaftlichkeit und die Stärkung des Datenschutzes durch Technik definiert. Damit wird die ideale Plattform für eine Datenauswertung mit den Methoden der künstlichen Intelligenz geschaffen, denn nur eine erfolgreiche Datenintegration macht den Einsatz von KI-Methoden möglich.

Denn grundsätzlich dreht sich beim Thema Künstliche Intelligenz alles um Daten. Unabhängig davon, ob private Unternehmen oder staatliche Organisationen auf KI setzen, das Prinzip ist stets das gleiche: Besteht der Input aus unbrauchbaren Daten, dann kann auch nur mit einem schlechten Output und damit mit unzureichender Intelligenz gerechnet werden. Künstliche Intelligenz, die nicht genau das leistet, was sie tatsächlich kann, bringt nichts.

Wenn Unternehmen oder ermittelnde Behörden also das Potenzial Künstlicher Intelligenz möglichst weit ausschöpfen wollen, dann darf trotz aller Begeisterung über neue, erfolgreiche Geschäftsmodelle und effiziente Sicherheitsszenarien die eigentliche Herausforderung nicht aus den Augen verloren werden: das Datenmanagement.

Anzeige

Um diesem Thema die gebührende Priorität einzuräumen, müssen alle, die KI nutzen wollen, auch sicherstellen, dass Daten schnell integriert, angereichert und bereitgestellt werden können. Nur so werden Verantwortliche eine gesicherte Entscheidungsgrundlage erhalten – egal, ob es um die technische Verbesserung einer Abgasanlage, um eine auf die sich ändernden Klimabedingungen optimal abgestimmte Aussaat in der Landwirtschaft oder um eine effizientere Fahndung handelt – Künstliche Intelligenz wird sich immer zuallererst mit dem Zugang zu sicheren Daten befassen müssen.

Die folgenden vier Punkte widmen sich den zentralen Fragen nach der Bereitstellung der Daten beim Einsatz Künstlicher Intelligenz:

1. Befinden sich die Daten in Silos?

Auch wenn Daten in der Vergangenheit in Silos organisiert wurden – die Aussicht, sie für die Analytik zu nutzen, erhöht die Notwendigkeit eines einfachen Zugangs. Die riesigen Datenmengen, die täglich zunehmen, erschweren es, Daten aus diesen Silos schnell genug bereitzustellen und zu nutzen. Daten aus einem bestimmten Silo einer Abteilung im Unternehmen oder einer Behörde können für andere Abteilungen oder andere Behörden durchaus kritisch sein. Darüber hinaus sind ältere Datenbanktechnologien nicht dafür geeignet, neue, oftmals unstrukturierte Daten einfach und schnell bereitzustellen. Moderne Technologien hingegen ermöglichen die Erfassung von Daten, so wie sie sind, unabhängig davon, ob sie strukturiert sind oder nicht. KI-Algorithmen benötigen nämlich den Kontext und die Metadaten aus allen Arten von Dateien und Berichten, um effektiv zu arbeiten. Je mehr Daten also für KI-Algorithmen zur Verfügung stehen, desto besser ist die Qualität der KI-Ergebnisse.

2. Sind die Daten sicher?

Sicherheit bedeutet mehr als nur der Schutz vor Diebstahl oder Cyberangriffen durch einen Perimeter. Datensicherheit bedeutet auch, dass Daten weder beschädigt noch gestohlen werden, auch wenn andere darauf zugreifen. Schließlich entfalten Daten nur dann ihre volle Stärke, wenn sie mit möglichst Vielen geteilt werden. Ein sicherer Datenaustausch ermöglicht auch die Kontrolle darüber, wer welche Daten sieht, bzw. sehen darf und damit arbeitet kann. Neuere Datenbanktechnologien bieten unterschiedliche Stufen von granularen Kontrollen, einschließlich solcher, die den Datenzugriff auf bestimmte Personen, vollständige Datenverschlüsselung, Redaktion und Anonymisierung einschränken. Sicherere Daten zu haben, bedeutet gleichzeitig, bessere Daten für KI-Algorithmen zur Verfügung zu haben.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

3. Wie gut ist das Datenmanagement?

Um Vertrauen in die Datenqualität zu haben, müssen die Daten gut verwaltet werden. Es sollte sichergestellt sein, dass sie entweder nicht geändert wurden oder aber dokumentiert wurde, wann, wie und von wem etwas geändert wurde. Richtlinien für die Data Governance – einschließlich der Datenschutzrichtlinien – müssen gemeinsam mit den Daten gespeichert werden, so dass sie weiterhin Gültigkeit haben, auch wenn die Daten an einem anderen Ort abgelegt werden. Damit kann sichergestellt werden, dass sie den Datenfluss und den Zugriff darauf nicht behindern.

4. Stehen die Daten in Echtzeit zur Verfügung?

Der Zugriff auf geschäftskritische Daten wird durch ein sogenanntes Data Hub verbessert, das in Echtzeit für ein besseres Verständnis der Daten sorgt und eine fundierte Entscheidungsfindung ermöglicht. Moderne Datenquellen senden permanent jede Menge an unterschiedlichsten Daten, die strukturiert oder unstrukturiert sein können: Dokumente, Bilder, Videos, Sensordaten. Sichere, agile Datenbanktechnologien empfangen die Daten, integrieren und präsentieren sie sicher und zuverlässig, so dass Analysen in Echtzeit erfasst und es damit zu einer besseren Einschätzung kommt. Dabei sind Frühwarnsysteme in Echtzeit ebenso entscheidend wie erweiterte Suchfunktionen. In beiden Disziplinen kann mit Hilfe von KI Algorithmen einfacher und schneller Erkenntnis gewonnen werden.

Fazit

Allgemein gilt: Egal ob in der Entwicklungsabteilung eines Mobilitätskonzerns, auf den Getreidefeldern der Landwirte oder bei nationalen Sicherheitsbehörden, die stark auf das Vertrauen der Bevölkerung angewiesen sind – jeder der KI einsetzen möchte, braucht einen integrierten Ansatz für sein Datenmanagement. Sowohl in der Echtzeitanalyse von potenziell gefährlichen Lagebildern, als auch in der Analyse vorhandener Daten im Rahmen gesetzlicher Vorgaben, können KI Algorithmen nur dann neue Erkenntnisse bringen, wenn die darunterliegende Datenbewirtschaftung durch eine Datenintegration mit einer modernen NoSQL Datenbank gewährleistet ist, die eine vollständige 360-Grad-Ansicht der Datensituation ermöglicht.

 

Stefan

Grotehans

Senior Director Solutions Engineering DACH

MarkLogic Deutschland GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.