Cloudera, das Unternehmen hinter der Enterprise Data Cloud, kündigt die Verfügbarkeit von Cloudera DataFlow für die Public Cloud an. Dabei handelt es sich um einen Cloud-nativen Datenfluss-Service zur Verarbeitung hybrider Streaming-Workloads auf der Cloudera Data Platform (CDP).
Mit Cloudera DataFlow für die Public Cloud können Anwender nun komplexe Datenflussvorgänge automatisieren, die betriebliche Effizienz von Streaming-Datenflüssen mit automatischen Skalierungsfunktionen steigern und Cloud-Kosten senken, indem die Dimensionierung der Infrastruktur nicht länger auf Vermutungen beruht.
Laut IDC’s Worldwide Global DataSphere IoT Device and Data Forecast, 2021-2025, wird ein exponentielles Wachstum des Data-in-Motion-Volumens von bis zu 79 ZB über alle Branchen hinweg erwartet. Viele Unternehmen nutzen bereits Apache NiFi, um Daten über hybride Cloud-Architekturen durch die visuelle Gestaltung von No-Code-Datenflüssen zu erfassen und zu verarbeiten. Auch wenn die Cloud eine einfache Möglichkeit zur Verarbeitung oder Speicherung großer Datenmengen bietet, gibt es mehrere Herausforderungen, die es zu bewältigen gilt. Die Bereitstellung zahlreicher anspruchsvoller Datenströme in einem einzigen Cluster kann Betriebs- und Monitoring-Probleme verursachen. Wenn mehrere NiFi-Flows um dieselben Ressourcen konkurrieren, kann dies zu Leistungsproblemen führen. IT-Administratoren entscheiden sich oft aus Vorsicht für größere Infrastrukturen, was zu einer unzureichenden Nutzung und hohen Kosten führt. Schließlich setzen Unternehmen auf ein Pay-as-you-go-Modell, um nicht für ungenutzte Ressourcen zahlen zu müssen.
Cloudera DataFlow für die Public Cloud ist ein Cloud-nativer Service für NiFi auf Kubernetes und umfasst wichtige Betriebs- und Monitoring-Funktionen, die diese Herausforderungen meistern und bei herkömmlichen Datenfluss-Services nicht verfügbar sind:
- Zentraler Datenfluss-Katalog für Verwaltbarkeit, Erkennung und Versionskontrolle
- Zentrales Dashboard für Monitoring, zur Fehlerbehebung und zur Leistungsoptimierung von Datenströmen über mehrere Cloud-Cluster hinweg
- Einfacher Bereitstellungsassistent und robuste APIs für die automatische Skalierung von Datenflüssen auf Kubernetes, die von der Cloudera Data Platform (CDP) verwaltet werden
- Vordefinierte Abläufe, so genannte „ReadyFlows“, für einige der gängigsten Streaming-Anwendungsfälle
Kosten und Verfügbarkeit
Cloudera DataFlow für die Public Cloud ist ab sofort auf AWS verfügbar.
https://de.cloudera.com