Aus diesem kurzen Zitat ergeben sich die grundlegenden Elemente:
- „other observations“: zwangsläufig muss immer ein Vergleichszeitraum gewählt werden
- „suspicions“: verdächtig ist, was nicht der Erwartung entspricht
- „deviates so much“: es muss definiert werden, wie hoch Abweichungen sein dürfen, um noch als unverdächtig zu gelten
- „different mechanism“: dies erfordert die Annahme einer bestimmten Verteilung der Messungen (z.B. Normalverteilung)
Etwas vereinfacht formalisiert folgen die meisten Verfahren also diesem Ansatz:
| Tatsächliches Verhalten – Erwartetes Verhalten | > verdächtige Abweichung?
Häufig werden voreilig (und unnötig) komplexe KI/ML Modelle ins Spiel gebracht, die jedoch diese grundlegenden Punkte auch nicht aus der Welt schaffen können:
- Wird zum Beispiel gerade ein komplexes Modell mit einem Bezugszeitraum trainiert, welcher Anomalien enthält, kann es sein, dass es diese hervorragend erfasst (also erwartet) und somit keine auffällige Abweichung mehr erkannt wird.
- Bei allen Verfahren muss zudem mindestens ein Parameter festgelegt werden, der Empfindlichkeit (Sensitivität) und das Risiko von Fehlalarmen (Spezifität) steuert. Damit kommt quasi der eingangs erwähnte Schwellwert wieder durch die Hintertür.
Verfahren zur Anomalie Erkennung
Das Feld der Verfahren ist riesig (bei Interesse empfehle ich die Lektüre des oben zitierten Forschungspapiers), daher hier nur die aus unserer Sicht für Predictive Maintenance wichtigsten Unterscheidungen:
- Wie schnell/zeitnah muss die Erkennung funktionieren, welche Rechenleistung steht hierfür zur Verfügung (Stichwort: Edge Computing)?
- Liegen ein- oder mehrdimensionale Daten (Sensor-, Steuer-, Prozess-Signale) vor bzw. müssen gemeinsam betrachtet werden?
- Können die in Frage kommenden Verfahren nur auf ein- oder auch auf mehrdimensionalen Daten arbeiten?
- Sind nur einzelne Zeitpunkte (z.B. Überschreitung einer kritischen Messwert Schwelle) oder Zeitsequenzen (= Verhaltensmuster) zu betrachten?
- Sind bestimmte Vorverarbeitungen der Signale hilfreich oder notwendig (z.B. Kurzzeit Fourier Transformation (STFT))
Bild 4: Visualisierung einer (Short-Time) Fourier Transformation von Sensor-Signalen
Nur am Rande: Häufig wird Anomalieerkennung mit ungestütztem Lernen (unsupervised learning) gleichgesetzt, dies ist aber nicht ganz korrekt: Viele Verfahren verwenden Modelle, die auf den Vergleichszeitraum trainiert werden und dann das erwartete Verhalten schätzen beziehungsweise prognostizieren. Darüber hinaus kommen beispielsweise auf der Dichte oder Distanz von Datenpunkten (z.B. Clustering) basierende Verfahren zum Einsatz.
Entscheidend: Interaktive und integrierte Lösung
Wir haben daher die Strategie gewählt, unsere Lösung kontinuierlich, um weitere Verfahren zu erweitern und diese vor allem in folgendes Gesamtkonzept zu integrieren:
Bild 5: Kombinierte Lösungsbausteine und Interaktion mit dem Fachanwender
- Vorverarbeitung: Eine geeignete Transformation der Rohsignale ist häufig entscheidend.
- Automatische Erkennung: Anwendung eines oder mehrerer automatischer Verfahren.
- Visualisierung und Interaktion: Fachgerechte Darstellung für den technischen Spezialisten und interaktive Markierung tatsächlicher Störungen.
- Erklärung und Diagnose: Identifizierung relevanter Einflussgrößen und Hinweise zu möglichen Zusammenhängen mit den Anomalien.
- Justierung und Training: Nutzung des Spezialisten Feedbacks für Justierung der Erkennung und Training der Verfahren.
Durch das Zusammenspiel dieser Bausteine sowie zwischen Anwender und Predictive Maintenance Anwendung können Expertenwissen und Erkennung von Mustern in komplexen Daten optimal miteinander kombiniert werden.
Ist das nicht kompliziert umzusetzen?
Tatsächlich sind in den meisten Fällen viele Faktoren zu berücksichtigen. Unser Erfolgsrezept sieht daher vor sowohl viele standardisierte Predictive Maintenance Lösungsbausteine zu liefern als auch gemeinsamen mit den Fachspezialisten das notwendige Domänenwissen zu integrieren und in kleinen Schritten zügige Zwischenergebnisse zu liefern, die möglichst schnell produktiv genutzt werden können.