Die aus einem Open-Source-Projekt heraus entstandene NoSQL-Datenbank »DataStax Enterprise« unterstützt nach AWS und Azure, nun auch die Oracle-Cloud. Weitere Anbindungen sollen folgen. Neben der Cloud gehört für Anbieter Datastax die Schulung und Unterstützung der Anwender zu den wichtigsten Investitionsschwerpunkten der nächsten Jahre.
Als Facebook 2009 seine Eigenentwicklung Cassandra der Open-Source-Community zur Verfügung stellte, war der Boden für die Gründung von Datastax 2010 in Austin, Texas, bereitet. Der Grund für die Entwicklung von Cassandra durch Facebook war, dass die Nutzer des Social-Network nicht mehr schnell genug in ihren Inboxen suchen konnten. Dafür musste eine Lösung her. Die Datenmassen, die durch Social, IoT und anderen Technologien erzeugt werden, brauchen nicht nur neue, schnellere Speichermedien wie SSD oder NVMe, sondern auch neue Datenmanagement- und Analysetechnologien.
Datastax trug in den folgenden Jahren massiv selbst zum Open-Source-Projekt Cassandra bei. Der große Einfluss des Unternehmens auf die Technologie zeigt sich auch darin, dass der Firmengründer und derzeitige CTO Jonathan Ellis gleichzeitig Vorsitzender des Cassandra-Projekts in der Open-Source-Community ist.
DSE: Masterlose Datenmanagement-Plattform
Billy Bosworth, Datastax: »Datastax Enterprise arbeitet global verteilt und kommt trotzdem ohne Master aus.« (Bild: Ariane Rüdiger)Open-Source-Projekte wie Cassandra entsprechen selten in ihrer ursprünglichen Form den Bedürfnissen von Unternehmen. So ist das in Java geschriebene Datenbank-Managementsystem zwar im Stande, große, strukturierte Datenmengen auf verteilten Clustern zu speichern. Es ist auch skalierbar und ausfallsicher. Allerdings hat Datastax laut CEO Billy Bosworth einige Spezialitäten hinzugefügt, die die Variante DataStax Enterprise (DSE) von anderen auf Cassandra aufsetzenden Produkten deutlich unterscheiden. »Wir sind der einzige Anbieter, der eine wirklich global verteilte masterlose Architektur anbieten«, sagt er. Sprich: Die einzelnen Speicherknoten und Cluster einer Cassandra-Implementierung sind wirklich gleichgeordnet, was Redundanzmechanismen erleichtert und singuläre Schwachstellen (Single-Point-of-Failure) verhindert. DSE speichert und analysiert heute Grafiken, JSON-Files, Dokumente, Tabellen und Key-Value-Stores.
Eine weitere Eigenheit: In Cassandra können die gewünschten Redundanzmechanismen sehr feingranular eingestellt werden – bis auf die Ebene einzelner Transaktionen. Asynchrone und synchrone Replikation sind möglich, wobei es sich laut Bosworth bei asynchroner Replikation meist nur um eine Zeitdifferenz von einigen hundert Millisekunden dreht. Wie oft etwas repliziert werden muss und wie viele der Zweitschriften bestätigt sein müssen, bis eine Transaktion als abgeschlossen gilt, lässt sich ebenfalls definieren. »Die meisten Anwender nutzen hier ein Quorum«, sagt Bosworth. Ist also eine bestimmte Mindestzahl von Replikationen bestätigt, gilt die Transaktion als erfolgreich erledigt.
Erweiterte Cloud-Unterstützung
Datastax kommt heute als Rundum-Produkt mit allen nötigen Funktionen (Bild: Datastax).Von 2010 bis 2013 beschäftigte sich Datastax laut Bosworth vor allem damit, das eigene Produkt bekannt zu machen. Danach wurden technische Ergänzungen aus dem Open-Source-Bereich hinzugefügt, beispielsweise Solr für die Suche oder Spark für die Datenanalyse. Für die Analyse grafischer Daten kaufte Datastax Aurelius mit seinem Produkt Titan hinzu. Andere Erweiterungen beschäftigten sich mit Sicherheit, also der Verschlüsselung oder der Integration mit Sicherheitsprotokollen wie LDAP. Auch Bosworth selbst wurde aufgekauft, zusammen mit einem Team von rund 20 Datenbankmanagementspezialisten bei der Übernahme von Quest.
Das Ganze bildet ein in sich geschlossenes, proprietäres Produkt, das Datastax in verschiedenen Varianten anbietet: als On-Premise-Lizenz zur Verwendung im eigenen Rechenzentrum oder auf einer bei einem Hoster gemieteten virtuellen Maschine, als Managed-Service aus der Datastax-Cloud und inzwischen auch als Managed-Service im Portfolio von AWS. »70 Prozent unserer Anwender nutzen Datastax heute über die Cloud«, sagt Bosworth. Auf Azure und seit Neuestem auch Oracle-Cloud können Anwender Datastax-Instanzen installieren. Das ist naheliegend, denn auch die Nutzer der Oracle-Datenbanken müssen sich heute mit neuen, Cloud-basierten Apps ausrüsten, um mitzuhalten. Für deren Daten ist aber ihre bewährte Oracle-Umgebung nicht ausgelegt. IBM-Cloud-Kunden dagegen müssen auf Datastax noch warten.
Anwendungsfelder sind einerseits Applikationen, die das Verhältnis zur Außenwelt gestalten oder erfassen wie 360-Grad-Kundenanalyse, Empfehlungen und Personalisierungen, Betrugsvorbeugung oder Authentisierung. Andererseits unterstützt Datastax interne Anwendungen, die häufig auch mit IoT arbeiten: Bestandsverwaltung und Asset Management, Optimierung von Logistik und Lieferketten. Die Kunden kommen aus allen Branchen. »Einen vertikalen Schwerpunkt gibt es nicht«, sagt Bosworth. Allerdings seien derzeit Großunternehmen mit internationaler Reichweite die bevorzugte Klientel. Abgerechnet wird wahlweise nach den virtuellen Maschinen oder nach den Prozessorkernen, auf denen Datastax läuft. Über Preise schweigt sich das Unternehmen aus.
Datastax: Positiver Cashflow in Sicht
Inzwischen beschäftigt das Unternehmen rund 480 Mitarbeiter und hat 450 Kunden. Datastax ist in 25 Ländern aktiv, in Europa gibt es Niederlassungen in Paris, London und Berlin. Aus Europa kommen 15 Prozent der Umsätze, fünf Prozent steuert Asien bei, der Rest ist US-Geschäft. Über den Umsatz redet Datastax nicht – immerhin rückt Bosworth heraus, nach fünf Venture-Capital-Finanzierungsrunden, in denen insgesamt 196 Millionen Dollar eingeworben wurden, sei nun ein positiver Cash-Flow in Sichtweite. Das Wachstum von Jahr zu Jahr liege noch immer bei mehr als 40 Prozent pro Jahr. Wichtige Wettbewerber sind etwa MungoDB oder Couchbase.
Vertrieben würde die Lösung vorwiegend direkt, aber das Unternehmen arbeitet dabei eng mit Partnern zusammen, die die Lösung als Teil eines Gesamtkonzeptes empfehlen. Als wichtigsten Cloud-Partner erwähnt die Website Microsoft Azure, technologisch arbeitet man beispielsweise mit HPE zusammen, das DSE auf seinen allerdings bisher nicht sonderlich erfolgreichen Moonshot-Maschinen anbietet, genau wie Cisco auf UCS. Auch ausgesprochene Cloud-Analytik-Spezialisten wie Cloudera oder Datameer finden sich auf der Partnerliste. Als Beratungspartner fungieren beispielsweise Accenture, aber auch die indische Wipro. Als OEMs sind CA und NetApp aktiv. Zu den Kunden gehören beispielsweise Microsoft, der Online-Händler eBay oder der RZ-Betreiber Equinix.
Verständnis für NoSQL schürren
In nächster Zukunft will Bosworth nicht so sehr in technologische Neuerungen investieren als darin, Anwendern beizubringen, wie sie sein Produkt und damit NoSQL-Technologie optimal nutzen können. »Derzeit geht es vor allem um die Implementierung. Viele interessieren sich für die Technologien, wissen aber noch nicht genau, wie sie sie für ihre Zwecke am besten verwenden«, meint Bosworth. Das sei auch nicht verwunderlich: Schließlich habe auch der Client-Server-Ansatz, der Mainframe-orientierte Architekturen in den Unternehmen ablöste, lange gebraucht, bis er sich breit durchsetzen konnte. Auch diesmal werde es nicht darum gehen, bestehende Datenbanken und Architekturen vollständig durch NoSQL und Cloud abzulösen. »Die meisten Unternehmen werden ältere Anwendungen und deren Daten weiter auf ihren bisherigen, relationalen Datenbanken betreiben, die neuen, Cloud-orientierten Applikationen aber auf NoSQL verlagern«, ist er überzeugt.