Im direkten Vergleich zeigt Apache Impala (Incubating) auf AWS bessere Cloud-Native-Eigenschaften und ein besseres Preis-Leistungs-Verhältnis als Amazon RedShift.
Cloudera hat Ergebnisse eines Vergleichstests veröffentlicht, denen zufolge Clouderas moderne analytische Datenbanklösung auf Basis von Apache Impala (Incubating) nicht nur bei Cloud-Workloads bisher nie da gewesene Fähigkeiten zeigt, sondern im Vergleich zu Alternativen auch ein besseres Preis-Leistungs-Verhältnis aufweist. Impala vereint elastische Skalierbarkeit, bessere Flexibilität und die Möglichkeit, Abfragen direkt von Amazon S3 durchzuführen. Traditionell aufgebaute Systeme wie RedShift bieten diese Möglichkeit nicht. Mit seinem modernen Design trennt Impala Daten und Rechenprozesse und bietet damit dieselben, hoch leistungsfähigen SQL-Analysen Cloud-nativ über Daten in S3 wie auch über eine große Bandbreite an On-Premise- und Cloud-Speicheroptionen. Obendrein bietet Impala eine um 275% bessere Kosteneffizienz und eine zehnmal höhere Leistung verglichen mit Amazons analytischer Datenbank RedShift. Unter dem Strich bleibt mehr Nutzwert – und das in einer offenen Plattform.
Cloudera hat Impala in der Cloud laufen lassen (sowohl Cloud-nativ über S3 als auch über lokalen EBS-Speicher) und mit Amazon RedShift verglichen (das nur auf eigenem Storage auf dedizierten AWS-Instanzen lauffähig ist). Die Abfragen wurden dem Standard-Benchmark der Branche, dem TPC-DS, entnommen. Die Ergebnisse des Benchmarks zeigen:
- Impala ist auf S3 mehr als 200% günstiger und mehr als zehnmal schneller als RedShift mit Standardeinstellungen.
- Impala ist immer noch 8% günstiger und 90% schneller im Vergleich zu einem RedShift, das vorher speziell für fixe Berichtsabfragen optimiert wurde.
- Impala ist zwischen 28 und 275% günstiger und zwischen 42 und 400% schneller auf EBS-Storage, je nachdem, ob RedShift optimiert oder mit Standardeinstellungen verwendet wurde.
„Unsere Kunden suchen nach Möglichkeiten, ihre BI- und analytischen Workloads in Cloud-Umgebungen zu verlagern, um die Kosteneffizienz elastischer Skalierung und größerer Flexibilität für sich zu nutzen. Aber dabei benötigen sie immer noch die Hochleistungsanalysen und Big-Data-Agility, die sie von ihren On-Premise-Systemen gewohnt sind”, so Charles Zedlewski, Vice President Products bei Cloudera. „Impala bringt alle Vorteile, die es gegenüber traditionellen On-Premise-Analysedatenbanken hat, in die Cloud, mit einer modernen Architektur für beispiellose Agilität, egal, wo die Daten liegen. Der Vergleich ist ein klarer Beleg dafür, dass Impala bei BI- und Analyseworkloads in der Cloud unübertroffen ist.”
Unternehmen suchen nach Wegen, mehr Daten aus neuen Quellen für sich zu nutzen. Um ihre Modelle an wechselnde Anforderungen anpassen und für eine Vielzahl an Anwendungsfällen schrittweise weiterentwickeln zu können, benötigen sie eine moderne Analysedatenbank, die speziell für diese Anforderungen gebaut wurde und die Produktivität nicht lähmt. Das rigide Design und die fehlende Elastizität bei der Skalierung macht traditionell aufgebaute, monolithische Systeme – egal ob On-Premise oder in der Cloud – ungeeignet für die sich ständig ändernden geschäftlichen Anforderungen der heutigen Zeit. Clouderas analytische Datenbank, angetrieben von Impala als interaktiver SQL-Engine, ist speziell für den Zweck gebaut, Hochleistungs-SQL-Analysen für Big Data durchzuführen, mit elastischer Skalierbarkeit für Cloud- und On-Premise-Installationen, wann immer sie benötigt werden.
Impala arbeitet nativ mit Daten, die auf einer Reihe von Storage-Engines gespeichert sind, darunter Amazon S3 Objektspeicher. Dadurch müssen Daten nicht in spezielle Impala-Cluster verschoben oder geladen werden. Insbesondere in Cloud-Umgebungen ist dies gleichbedeutend mit Kosteneinsparungen und Effizienz. Je nach Bedarf können temporäre Cluster für BI- und Reporting-Workloads hochgefahren werden, mit günstigem Storage von S3. Dadurch stehen mehr Daten schnell für Analysen zur Verfügung.
Die Weiterentwicklung der Performance, Parallelität und Skalierbarkeit von Impala ist ein Schwerpunkt bei Cloudera. Das Unternehmen hat den Leistungsvorsprung von Impalas analytischer Datenbankarchitektur gegenüber anderen Alternativen sowohl für einzelne als auch für Multi-User-Workloads ausgebaut. Die letzte Version liefert eine zwölfmal höhere Leistung bei sicheren Workloads als die beiden Vorgängerversionen. Cloudera plant, den Nutzwert und den Preisvorteil von Impala weiter auszubauen, indem zukünftig auch andere Objektspeicher in der Public Cloud unterstützt werden.