Zurück in die Zukunft: Vor hundert Jahren ließen sich die meisten Menschen vor allem Anzüge noch nach Maß schneidern und die Kunden erhielten eine individuelle Modeberatung in den Geschäften. Im Zuge der Massenproduktion kauften immer mehr Menschen Kleidung von der Stange. Dies setzte sich im Online-Zeitalter fort. Doch nun ermöglichen neue Technologien wie Deep Learning wieder eine individuelle Beratung – durch Algorithmen und Maschinen.
Deep Learning
Computer denken nicht wie Menschen. Dies zeigt sich schon daran, dass für den Menschen komplizierte Rechenaufgaben selbst durch einfache Maschinen in Sekundenbruchteilen gelöst werden. Der Trick liegt in der Beschreibung klarer mathematischer Regeln. Umgekehrt kann ein Mensch einfach Gesichter erkennen – Computer arbeiten noch heute daran. Dazu müssen sie aus Erfahrung lernen und die Aufgabe in Form einer Hierarchie von Konzepten verstehen können. Das bedeutet: Es werden komplizierte Konzepte aus einfacheren Konzepten zusammengebaut. Als Diagramm wird dies mit vielen übereinanderliegenden Schichten dargestellt, woraus der Begriff „Deep Learning“ (tiefgehendes Lernen) entstand.
Die dabei genutzten neuronalen Netze sind ähnlich wie das menschliche Gehirn strukturiert. Die erste Schicht verarbeitet die rohen Daten, etwa die einzelnen Pixel eines Porträtfotos. Sie leitet ihre Ergebnisse an die nächste Schicht weiter, diese wiederum an die darauffolgende Schicht und so weiter. Letztlich erkennt das System dann aus den einzelnen Pixeln das Gesicht und kann es im Idealfall korrekt einer bestimmten Person zuordnen. Dieses Prinzip hat neben der gestiegenen Rechenkapazität unter anderem dazu geführt, dass Computer dem Menschen in Spielen wie Go überlegen sind. Deep Learning wurde hier zum Training des neuronalen Netzes eingesetzt. Dies erfolgt durch die Einspeisung von großen Datenmengen, damit es Muster erkennt und Anomalien entdeckt.
Kombination mit der Cloud
Dieser Vorgang wird heute durch die enormen Rechen- und Speicherkapazitäten in der Cloud unterstützt. Damit ist es viel einfacher, neuronale Netze zu entwickeln, die verschiedene Möglichkeiten und Szenarien vorhersehen. Zum Beispiel können Automobilhersteller und ihre Partner riesige Mengen an realen Daten sammeln und analysieren, um autonome Autos zu trainieren. So beschreibt etwa „The Top 50 EMEA Cloud Climbers 2017 Report“ von F5 Networks eine „Car as a Sensor“-Lösung (CARASSO) von BMW. Diese soll 2018 die gesammelten Daten von 100.000 Fahrzeugen bearbeiten, die insgesamt mehr als 8 Milliarden Kilometer zurücklegen.
Zalando bietet individuelle Beratung
Deep Learning wird inzwischen aber auch von Modeanbietern wie Zalando eingesetzt. Das Berliner Unternehmen nutzt dabei Cloud-basierte Ansätze, um das Kundenverhalten zu verstehen und ihre Wünsche vorherzusagen. Im wechselhaften Geschäft der Modebranche und dem wettbewerbsintensiven Online-Handel ist dies für den nachhaltigen Erfolg wichtig. „Technologische Fortschritte sind die entscheidenden Treiber für die zweite Welle des E-Commerce, die das weitere Wachstum des Online-Modegeschäfts unterstützt“, sagt Eric Bowman, Vice President Digital Foundation bei Zalando. „Eine große Herausforderung für Vorhersagen ist der saisonale Wechsel, wobei beliebte Marken kommen und gehen. Zudem wird jeden Tag eine große Menge an neuen Artikeln auf unserer Plattform aufgenommen. Dies erfordert ein häufig aktualisiertes Training und permanente Modell-Entwicklung, wobei Methoden für Deep Learning enorme Kapazitäten an Datenverarbeitung, Rechenzeit und Prozessorleistung benötigen. Unsere Hybrid-Cloud-Architektur ist der einzig mögliche Weg, um diese Anforderungen zu erfüllen.“
Das „Adtech Lab“ von Zalando in Hamburg hat das Deep-Learning-System entwickelt. Es sagt die künftigen Modeinteressen der Kunden auf Basis einer ausführlichen Analyse des bisherigen Verhaltens und von Online-Interaktionen voraus. Das System nutzt dazu periodische neuronale Netze (Recurrent Neural Networks, RNNs) sowie Datenspeicher, -verdichtung und -analysetools von Amazon Web Services (AWS). Zudem werden über einen High-Performance Computing Cluster im eigenen Haus die Deep-Learning-Modelle trainiert. Dabei kommen anonymisierte Daten zum Einsatz, um den Datenschutz für die Kunden zu gewährleisten.
Event-Stream-Daten aus dem Online-Shop werden über mehrere Monate hinweg gesammelt und in anonymisierte Kundenhistorien zusammengestellt, die direkt in die RNNs für das Training eingefügt werden. Dazu nutzt Zalando Datenverarbeitungsprozesse auf Basis von Apache Spark. Die Aggregation und Vorhersage läuft auf AWS EMR und EC2, die Ergebnisse werden in AWS S3 gespeichert. „Im nächsten Schritt wird das Modell-Training in die Cloud verlagert, um eine stabilere und skalierbarere Lösung zu erhalten“, sagt Bowman. „Anschließend wollen wir Echtzeit-Vorhersagen generieren. Wir möchten die Vorhersage-Genauigkeit erhöhen und die Einsatzszenarien erweitern.“ Denn je besser die Vorhersagen sind, desto genauer werden die individuellen Kundenwünsche erfüllt und die Zufriedenheit steigt. Damit können die Maschinen über Deep Learning zum persönlichen Modeberater werden.
Ralf Sydekum, Technical Manager DACH, F5 Networks GmbH