Daten im Archiv sind meist nicht nur »Cold Data«, sondern oft auch »Dark Data«. Zwar ist grob bekannt, ob es sich um Baupläne, Vertragsunterlagen, Röntgenbilder oder Filmaufnahmen handelt, der Detailanalyse verschließen sie sich jedoch. Im Zuge des KI-Booms soll sich das ändern. Aber ist das ohne weiteres möglich?
Vor Kurzem leistete ich einem Freund, der als Hobbyhistoriker tätig ist, einen Hilfsdienst. Er war auf der Suche nach einem beinahe ein Jahrhundert alten Magazinartikel, der ausschließlich in der Bayerischen Staatsbibliothek in München verfügbar war. Da er nicht vor Ort sein konnte, registrierte ich mich persönlich an der Bibliothek und meldete mich über das Online-System für den Zugang an. Nach der Online-Bestellung der Zeitschrift konnte ich sie zwei Tage später im Lesesaal einsehen.
Mein Besuch in der Bibliothek umfasste die Reservierung eines Arbeitsplatzes im Lesesaal, den Kauf einer Kopierkarte, das Kopieren des Artikels und das Speichern des Dokuments auf einem USB-Stick. Anschließend übertrug ich die Datei an meinen Freund, der sich über die Zusendung sehr freute. Ich habe es gerne getan.
Archivieren, um zu vergessen
Warum erzähle ich diese Geschichte hier? Archivierung in Unternehmen folgte bisher oft ähnlichen Mustern. Zwar machen physische Dokumente nur einen kleinen Teil der Daten aus – aber auch sie wollen und müssen in einigen Fällen archiviert werden. Doch selbst bei digitalen Daten war und ist Archivierung eher darauf ausgelegt, dass die Daten in Not- und Sonderfällen lange im Zugriff bleiben. Die regelmäßige Nutzung ist beim Archiv per Definition nicht vorgesehen.
Die Prozesse für den Zugriff sind daher oft etwas umständlich. Zu Recht: Schließlich kann nicht einfach jeder ins Archiv gehen und sich Tapes oder optische Speichermedien holen, von denen er glaubt, dass sie für seine Arbeit relevante Daten enthalten. Der Vorgang muss kontrolliert und geregelt vonstattengehen – ähnlich wie der Zugriff auf seltene alte Zeitschriften in der Bayerischen Staatsbibliothek.
KI aktiviert alte Daten
Innovation durch Künstliche Intelligenz: Die Integration von KI in geschäftliche Prozesse erhöht die Anforderungen an Archivsysteme. Laut Jan Dittel, einem IT-Consultant bei bluvisio, erfordert das Training von KI-Modellen schnellen Zugriff auf große Datenmengen, die oft in Archiven schlummern. Dies hat zur Folge, dass Archivdaten zunehmend auf kostengünstigen, leseintensiven Flash-Speichern gehalten werden.
Die Evolution der Datenspeicherung: Rob Lee von Pure Storage sieht in der Nutzung von Flash-Speichern eine fortschrittliche Lösung, da deren Kosten inzwischen gesunken sind. Er argumentiert gegen die isolierte Aufbewahrung von Daten in unterschiedlichen Speichern und plädiert stattdessen für eine stärkere Vernetzung der Speicherorte.
Wandel durch Hybridmodelle und Cloud-Lösungen: Der Übergang zu hybriden Modellen, die sowohl lokale als auch Cloud-Speicherlösungen umfassen, gewinnt an Bedeutung. Cloud-Archivierungsanbieter wie Cohesity und Rubrik bieten niedrige Einstiegskosten und reduzieren die laufenden Betriebskosten. Sie argumentieren, dass Daten in der Cloud leichter zugänglich und damit für KI-Anwendungen schneller nutzbar sind.
Schlussfolgerung: Es zeigt sich, dass sowohl traditionelle als auch neuere Datenspeicherungsansätze ihre Vorzüge haben, jedoch die Integration von KI neue Anforderungen stellt, die eine Anpassung der Speicherstrategien erfordern. Unternehmen stehen vor der Herausforderung, diese neuen Technologien so zu integrieren, dass sie sowohl kosteneffizient als auch performant sind und dabei die Zugänglichkeit und Sicherheit der Daten nicht beeinträchtigen.
Weiterführende Links: