Durch die steigende Globalisierung, der weit vernetzten Lieferketten und der stetigen Veränderung im Umfeld von Unternehmen wachsen die Herausforderungen für die Entscheidungsträger im Supply Chain Management. Zur Beherrschung der immer größer werdenden Komplexität sind genaue Prognosen des Bedarfs zwingend erforderlich.
Als Teilgebiet der Künstlichen Intelligenz kann Machine Learning dabei helfen, präzise Prognosen zu generieren und so eine sichere Grundlage für die Planung zu gewährleisten. Daraus resultierende Vorteile wie zum Beispiel die Reduzierung der Lagerbestände und gleichzeitige Optimierung der Lieferfähigkeit verbessern zudem das Betriebsergebnis. Machine Learning nutzt lernende Algorithmen zur Erkennung von Mustern und Gesetzmäßigkeiten in Daten und ist in der Lage sich durch Rückkopplungen automatisch und selbstständig anzupassen und so auf Veränderungen zu reagieren.
Damit die Methoden des Machine Learnings erfolgreich zur Bedarfsprognose eingesetzt werden können, sind allerdings mehrere Herausforderungen zu überwinden. Während der Entwicklung eines Demonstrators zur Veranschaulichung der Unterschiede zwischen Verfahren des Machine Learnings, des Deep Learnings und der Statistik konnten wir dazu hilfreiche Erfahrungswerte sammeln. Welche Daten sollten verwendet werden? Wie sollten die Daten vor dem ML-Einsatz aussehen? Wie wird ein Verfahren ausgewählt und trainiert? In diesen Bereichen konnten wir wertvolle Erkenntnisse gewinnen, die wir gerne mit Ihnen teilen möchten, damit Sie erfolgreich eine auf Machine Learning basierende Bedarfsprognose implementieren können.
Nur gute Daten erzeugen gute Ergebnisse
Bedarfsprognosen, die durch selbstlernende Algorithmen erzeugt werden, benötigen Daten, die dem Absatz nahestehen. Damit durch das Maschinelle Lernen eine hohe Prognosegüte erreicht werden kann, wird allerdings eine bestimmte Menge an Daten gebraucht, die in einer guten Qualität vorliegen müssen. Hierbei gilt der Grundsatz, dass das ML-Verfahren nur so gut sein kann, wie die Daten, mit dem das Verfahren „gefüttert“ wird.
Unsere eigenen Erfahrungen zeigen, dass die Datenmenge und der Datenursprung für jeden Anwendungsfall differenziert betrachtet werden muss. Um die Aktualität der Daten sicherzustellen, sollten Ihre Input-Daten jedoch nicht älter als 5 Jahre sein. Im Zusammenhang der Datenqualität ist bei den Eingangsdaten darauf zu achten, dass nur wenige fehlende Werte und Ausreißer in den Datensätzen vorkommen, da ansonsten das Machine Learning Modell möglicherweise fehlerhafte Ergebnisse generiert. Sollte der Datensatz keine ausreichende Datenqualität aufweisen, muss er durch einen intensiven Prozess aufbereitet werden.
Daten als Rohstoff für die Prognose vorbereiten
Die kann eine besondere Hürde vor der Nutzung von Verfahren des Machine Learnings darstellen, denn sie kann sehr zeitintensiv sein. Gleichzeitig ist die Datenaufbereitung aber notwendig für eine erfolgreiche Umsetzung und zahlt sich später auf jeden Fall aus.
Verfälschende Daten wie Ausreißer oder fehlende Daten können Sie durch Durchschnittswerte oder durch Interpolationen ersetzen. Achten Sie zudem darauf, dass Ihre Datensätze miteinander vergleichbar sind. Als wesentliche Bestandteile der Datenaufbereitung sind hier die Stichwörter “Normalisierung” und “Transformation” zu nennen.
Gleichermaßen müssen Sie Ihre Daten mit Branchenwissen verknüpfen und an den Anwendungsfall zu koppeln. Genau in diesem Schritt – nämlich in der Herstellung von Korrelationen – unterscheiden sich ML-Verfahren von klassischen zeitreihenbasierten Prognosen. Durch die gegebenen Korrelationen können Wechselbeziehungen vom Algorithmus besser beachtet und für eine genauere Prognosegüte verwendet werden.
Liegen Daten in der richtigen Form vor, muss nun ein Verfahren aus dem Machine Learning ausgewählt werden, die zur vorliegenden Datengrundlage passt. Was muss hierbei berücksichtigt werden?
Übung macht den Meister – aber nur mit dem richtigen Verfahren
Die auf den jeweiligen Verfahren basierenden Modelle benötigen für eine gute Prognoseleistung unterschiedlich viele Daten. Gleichzeitig müssen Phänomene wie mögliches Overfitting bzw. Underfitting beachtet werden, die oftmals mit dem ausgewählten Verfahren und der zur Verfügung stehenden Datenmenge in Verbindung stehen.
Neben der benötigten Datenmenge und dem zu leistenden Implementierungsaufwand sollten Sie bei der Auswahl des Verfahrens aus dem Machine Learning außerdem auf die verschiedenen Verläufe in den Absatzdaten achten. Einige Verfahren können beispielsweise die Saisonalität besser verarbeiten als andere. Machen Sie sich also zunächst ein Bild von Ihren Daten und bauen Sie ein Datenverständnis auf, bevor Sie ein Verfahren auswählen!
Damit das ML-Verfahren eine konstant gute Prognosegüte erzeugt, muss das Modell immer wieder mit neuen Daten trainiert werden, um beispielsweise auf Veränderungen angepasst werden zu können. So entsteht ein Kreislauf, der immer wieder durchlaufen wird: Daten werden gesammelt, vorverarbeitet und wieder im Verfahren für die Bedarfsprognose während des Trainings des Modells genutzt.
Bild: Kreislauf der auf Machine Learning basierenden Bedarfsprognose innerhalb einer Wertschöpfungskette, Quelle: Fraunhofer IML
Verfahren aus dem Machine Learning sind allerdings nicht immer grundsätzlich besser als konventionelle Prognoseverfahren aus der Statistik. Liegen nicht genügend Daten vor oder nur in einer sehr geringen Qualität, sollten Sie über die Verwendung eines statistischen, „nicht-lernenden“ Verfahrens nachdenken. Aber auch diese Entscheidung ist von Anwendungsfall zu Anwendungsfall unterschiedlich zu treffen.
Die Entwicklung des ML-Demonstrators hat uns gezeigt: Das Implementieren von Verfahren aus dem Machine Learning ist mit viel Aufwand verbunden. Es müssen immer alle individuellen, datenseitigen sowie modellseitigen Anforderungen berücksichtigt werden. Dennoch birgt der Einsatz von Verfahren des Machine Learnings hohe Potentiale und ist in der Zukunft ein wichtiges Werkzeug in der Bedarfsprognose immer komplexer werdenden Lieferketten.