Machine Learning (ML) als Teilgebiet der Künstlichen Intelligenz (KI) gilt als eine Schlüsseltechnologie für Finanzdienstleistungsunternehmen, die sich über effiziente automatisierte Prozesse in einem sich immer schneller verändernden Wettbewerbsumfeld behaupten wollen – und die dabei gleichzeitig die Sicherheit und Zuverlässigkeit dieser Prozesse sicherstellen müssen.
Das Streben nach Effizienz ist eine Folge des Wettbewerbsdrucks. Er veranlasst Anbieter von Zahlungsdienstleistungen, möglichst schnelle Transaktionen anzubieten, die möglichst geringe Transaktionskosten aufweisen.
Gleichzeitig sorgt der Gesetzgeber dafür, dass dies nicht zulasten der Sicherheit und Zuverlässigkeit dieser Transaktionen geht. Finanzinstitute sind beispielsweise dazu verpflichtet, Maßnahmen zur Geldwäscheprävention oder zur Vorbeugung von Terrorismusfinanzierung zu ergreifen. Dabei treiben steigende Nutzungszahlen die Kosten für die Zahlungsüberwachung in die Höhe. Im Zeitalter von Instant Payment und dem Wunsch vieler Kunden nach einer Verfügbarkeit von 24 Stunden an sieben Tagen die Woche ist eine manuelle Überwachung und Steuerung dieser Vorgänge technisch und finanziell schlichtweg nicht mehr zu bewältigen.
Es besteht ein unübersehbarer Trade-off zwischen Effizienz und Sicherheit. Machine Learning bietet hochinteressante Möglichkeiten, diesen Trade-off dadurch zu überwinden, dass auf der Seite der Sicherheit ähnliche Effizienzsprünge erreicht werden, wie sie bei der Abwicklung von Instant-Payments bereits erfolgt sind. Aber wie kann das konkret geschehen?
Instant Payments als Risiko im Zahlungsverkehr
Um betrügerischen Handlungen entgegenzuwirken und so die gesetzlichen Auflagen zu erfüllen, arbeiten Banken bisher meist mit Softwaresystemen, die alle Transaktionen nach einem individuell angelegten Regelwerk überwachen. Das Regelwerk gibt vor, welche Zahlungen von dem System angehalten und nicht sofort ausgeführt werden sollen. Das bietet der Bank die Möglichkeit, die identifizierten Zahlungen manuell zu überprüfen. Der Betrugsbeauftragte analysiert bei der Prüfung das historische Zahlungsverhalten des Kunden.
Ergibt sich aus der Zahlungshistorie keine Information über die Echtheit der Zahlung, nimmt die Bank Kontakt mit dem Auftraggeber auf. Erweist sich der Verdacht als unbegründet, wird die Zahlung freigegeben. Kann der Betrugsverdacht jedoch bestätigt werden, werden alle relevanten Informationen dokumentiert und eine polizeiliche Untersuchung wird eingeleitet. Greift allerdings keine der zuvor angelegten Regeln, kann die Software auch keine verdächtige Transaktion identifizieren und die Zahlung wird ohne weitere Prüfung ausgeführt.
Kritisch für die Betrugsprävention bei Instant-Payment-Zahlungen ist vor allem die Geschwindigkeit der Transaktionen. Eine Echtzeitüberweisung ist deutlich schneller als eine gewöhnliche SEPA-Überweisung. Das Konto des Auftraggebers wird sofort belastet, und das Geld wird sofort auf dem Konto des Begünstigten verfügbar gemacht. Die Transaktion wird in Sekundenschnelle ausgeführt. Deshalb ist es entscheidend, dass auch die Mechanismen zur Betrugsprävention in Echtzeit und mit hoher Verfügbarkeit arbeiten.¹
Genau diese Geschwindigkeit treibt Banken in ein Dilemma. Denn durch die Ausarbeitung ihres Regelwerks müssen sie entscheiden, welche Zahlungen sie buchen und welche sie abweisen. Ist das Regelwerk zu eng, werden viele Überweisungen abgewiesen und gegebenenfalls erst nach Rücksprache ausgeführt, was zu Kundenunzufriedenheit und hohen Prüf-Kosten führen kann. Ein großzügigeres Regelwerk führt zu besserer Kundenzufriedenheit, birgt jedoch das Risiko von Reputationsschäden und Geldverlusten bei Bank und Kunde.²
Mit einem Anteil von über 13% an allen SEPA-Überweisungen nehmen Instant-Payments einen nicht zu vernachlässigendes und vor allem potenziell weiter steigendes Gesamtvolumen ein, weshalb diese Überlegungen gut durchdacht sein sollten.³
Dabei kann Machine Learning unterstützen. Es bietet den Vorteil, dass neben den Regeln, die von Menschenhand konstruiert sind, durch den Algorithmus auch eigenständig Regeln entwickelt werden, um Zusammenhänge und Anomalien zu erkennen und so auffällige Zahlungen zu identifizieren. Dadurch lassen sich im besten Fall neue auffällige Zahlungen entdecken, die vorher ungesehen verbucht worden wären.
Machine Learning als „Werkzeugkoffer“
ML befasst sich mit der Entwicklung von Algorithmen, um Computern die Fähigkeit zu verleihen, mit Hilfe von Daten Abhängigkeiten oder Regeln zu erkennen und zu erlernen. In der Praxis können dadurch Problemstellungen gelöst werden, die für den Menschen als zu komplex erscheinen oder bei manueller Überwachung einen so hohen Ressourceneinsatz erfordern würden, dass dies im Wettbewerb nicht nachhaltig möglich wäre.
Der Vorteil von ML-Anwendungen ist ihre Eigenschaft, ihr etwaiges Verhalten an den Dateninput und ihre Umgebung anpassen und so flexibel auf Neues reagieren zu können.⁴ Ähnlich einem „Werkzeugkoffer“ bietet ML verschiedene Vorgehensweisen bzw. „Werkzeuge“, um eine Lösung für ein Problem zu entwickeln. Je nach Problemstellung eignet sich dabei das eine Werkzeug besser als das andere. In der Regel wird zwischen überwachtem Lernen (Supervised Learning), unüberwachtem Lernen (Unsupervised Learning) und bestärkendem Lernen (Reinforcement Learning) unterschieden.
Das Supervised Learning beschreibt eine Vorgehensweise, bei der der Algorithmus mit Daten trainiert wird, für die bereits eine Kategorisierung vorgenommen wurde. Am Beispiel Instant Payment bedeutet das, dass der Computer mit einem Datensatz trainiert wird, in dem die einzelnen Zahlungen entweder als betrügerisch oder nicht betrügerisch klassifiziert sind. Im besten Fall entwickelt und erkennt der Computer anhand dieser Daten Zusammenhänge und entwickelt ein Modell, um zukünftig noch unbekannte Daten eigenständig nach den eigenen Regeln zu klassifizieren.⁵
Unsupervised Learning bedeutet dementsprechend, dass der Computer ohne vorhandene Klassifizierungen im Datensatz trainiert wird. Dabei sollen gemeinsame Eigenschaften und Unterschiede in den Daten identifiziert und die Daten in verschiedene Cluster unterteilt werden. Übliche Anwendungsfälle für dieses Vorgehen sind Kundensegmentierungen nach Kaufverhalten, aber auch Anomalieerkennungen.⁶
Das Reinforcement Learning findet vor allem in Spielsituationen Anwendungen. Ziel dieses Vorgehens ist es, mittels positiver oder negativer Rückmeldung das optimale Verhalten in einer Situation hervorzurufen. Führt eine Aktion beispielsweise dazu, dass sich der Punktestand eines Spielers erhöht, ist das eine positive Rückmeldung und die Maschine führt diese Aktion in vergleichbaren Situationen verstärkt aus.⁷
Vereinfacht kann die Implementierung einer ML-Lösung in drei Phasen unterteilt werden. In der ersten Phase (Lernphase) erzeugt ein Algorithmus ein Modell anhand ausgewählter Daten. Die zweite Phase (Testphase) dient dazu, die Güte bzw. Qualität des Modells zu bestimmen und zu bewerten. In der dritten Phase (Anwendungsphase) werden dem Modell noch unbekannte Daten zur Verfügung gestellt, um den zukünftigen Einsatz des Modells in der Praxis zu simulieren.⁸
Trainingsdaten: eine wertvolle Ressource
Der Einsatz von Machine Learning kann nur dann zum Erfolg führen und dabei helfen, Prozesse zu automatisieren und zu optimieren, wenn ausreichend Daten zur Verfügung stehen, um ein effektives und effizientes Modell zu entwickeln. In vielen Fällen stehen durch Big Data den Unternehmen die benötigten Daten für den Einsatz von ML bereits innerhalb des Data Warehouse (DWH) zur Verfügung und müssen nur noch zusammengeführt werden. Die Schwierigkeit liegt jedoch darin, die richtigen Daten für den vorliegenden Anwendungsfall zu finden.
Fällt die Entscheidung beispielsweise auf das Supervised Learning, bedeutet das, dass sowohl eine möglichst große Menge an als „betrügerisch“ wie auch an als „nicht betrügerisch“ klassifizierten Daten vorliegen muss. Ist das nicht der Fall, wird das trainierte Modell in der Praxis kaum einen Mehrwert bieten. Mittels Ergebnisanalyse kann nach erfolgtem Training die Güte des entwickelten Modells bewertet werden. Als wichtige Kennzahlen gelten hierbei:
True Positives (TP) | Historische Zahlungsverkehrstransaktionen, welche von dem entwickelten Modell richtigerweise als „betrügerisch“ erkannt werden. |
True Negatives (TN) | Historische Zahlungsverkehrstransaktionen, welche von dem entwickelten Modell richtigerweise als „nicht betrügerisch“ erkannt werden. |
False Positives (FP) | Historische Zahlungsverkehrstransaktionen, welche von dem entwickelten Modell, fälschlicherweise als „betrügerisch“ identifiziert werden. |
False Negatives (FN) | Historische Zahlungsverkehrstransaktionen, welche von dem entwickelten Modell fälschlicherweise als „nicht betrügerisch“ identifiziert werden. |
Einen ersten Richtwert für die Effektivität des entwickelten Modells geben die TP-Fälle. Aus ihnen kann abgeleitet werden, ob das entwickelte ML-Modell betrügerische Transaktionen aus der Vergangenheit erkennt. Für die Praxis ist jedoch auch die Effizienz des Modells von hoher Bedeutung. Anhand der FP-Fälle kann beispielsweise erkannt werden, welche Transaktionen von dem Modell fälschlicherweise als „betrügerisch“ eingestuft wurden.
Nur wenn Nutzen und Aufwand in Form von Risikominimierung und Kosten in einem verträglichen Verhältnis stehen, ist die Prozessoptimierung mittels ML sinnvoll. Denn jede fälschlicherweise als „betrügerisch“ gekennzeichnete Transaktion macht weitere manuelle Schritte wie die Einbindung eines zuständigen Kundenberaters und die Kommunikation mit dem Kunden zur Sicherstellung der Richtigkeit der Zahlung notwendig. All dies verursacht monetäre und nicht-monetäre Kosten.
Obwohl die verfügbare Datenmenge im Bereich Zahlungsverkehr stetig ansteigt, stellt sie für den erfolgreichen Einsatz von ML als Tool zur Betrugserkennung noch immer die größte Herausforderung dar. Das Zahlungsverkehrsverhalten der Kunden zählt zu den hoch sensiblen Daten, weshalb unter den Banken kein Austausch der Daten erfolgt. Das hemmt den Einsatz von ML, obwohl das Teilen der Daten durch Anonymisierung und Pseudonymisierung möglich wäre. Je nach Größe des Instituts bedeutet das außerdem, dass der Bank ggf. nicht ausreichend betrügerische Transaktionen vorliegen, um ein eigenes, effektives und effizientes Modell entwickeln zu können.
Liegen genügend Daten zur Entwicklung eines funktionierenden Modells vor, muss ferner seine Erklärbarkeit sichergestellt werden. Banken sind durch die Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) angehalten, nur Programme einzusetzen, welche beschrieben werden können und nachvollziehbar sind. Die Gründe zu ermitteln, aus welchen Gründen eine bestimmte Transaktion von einem ML-Modell gestoppt wurde, kann dabei einige Zeit in Anspruch nehmen.
Eine „Blackbox-Ausrede“, dass die Entscheidung des Modells nicht nachvollziehbar ist, ist Seitens der Aufsichtsbehörde nicht zulässig. Es kommt also bei der Entwicklung des Modells darauf an, einerseits ein möglichst effizientes Modell zu entwickeln, das die Möglichkeiten von KI und ML möglichst umfassend nutzt, andererseits aber die Komplexität des Modells so gering zu halten, dass seine Funktionsweise noch hinreichend beschreibbar bleibt.
Zusammenfassung und Ausblick
Zusammenfassend lässt sich feststellen, dass der Einsatz von Machine Learning als Tool für die Betrugserkennung enorme Potenziale bietet, um den Trade-off zwischen Effizienz und Sicherheit, der sich bei Instant Payment und einem unaufhaltsam steigenden Volumen schneller Transaktionen immer drängender stellt, wenn nicht gänzlich zu überwinden, so doch erheblich abzumildern.
Die dadurch mögliche Steigerung der Kundenzufriedenheit, die Verhinderungen von Reputationsschäden und der effiziente Personaleinsatz durch genauere Identifizierung von betrügerischen Transaktionen bieten starke Argumente für die Prozessoptimierung mittels ML. Erste Ergebnisse lassen sich oft bereits mit der bereits vorhandenen Hardware erreichen. Die Abwägung von Kosten und Nutzen ist darüber hinaus individuell nach Problemstellung zu betrachten. Mit Fokus auf dem qualitativen ROI (Return in Investment) ist der Einsatz in vielerlei Hinsicht eine Überlegung wert.
Für den Erfolg ist allerdings ein ausreichend großer Datensatz mit den richtigen Merkmalen unumgänglich. Ein Austausch anonymisierter historischer Zahlungsdaten könnte es gerade auch kleineren Instituten ermöglichen, die Vorteile der Technologie zur Steigerung von Wettbewerbsfähigkeit und Zahlungssicherheit zu nutzen.
¹ Vgl. European Payments Council (2021), S. 47.
² Vgl. Diadjuschkin et al. (2019), S. 72f.
³ Vgl. European Payments Council (2022).
⁴ Vgl. Shalev-Shwartz und Ben-David (2014), S. 22.
⁵ Vgl. Nguyen und Zeigermann (2021), S. 4.
⁶ Vgl. Bundesanstalt für Finanzdienstleistungsaufsicht (2018), S. 28.
⁷ Vgl. Nguyen und Zeigermann (2021), S. 8.
⁸ Vgl. Bundesanstalt für Finanzdienstleistungsaufsicht (2018), S. 27.
Literatur
Bundesanstalt für Finanzdienstleistungsaufsicht (2018): Big Data trifft auf Künstliche Intelligenz – Herausforderungen und Implikationen für Aufsicht und Regulierung von Finanzdienstleistungen.
Diadjuschkin, Alexander, Sandkuhl, Kurt, Maiatin, Alexander (2019): Fraud Detection in Payments Transactions: Overview of Existing Approaches and Usage for Instant Payments, in: Complex Systems Informations Modeling Quartlery, Vol. 20 (Oktober 2019), S. 72-88.
European Payments Council (2021): 2021 Payment Threats and Fraud Trends Report.
European Payments Council (2022): SEPA Instant Credit Transfer <https://www.europeanpaymentscouncil.eu/what-we-do/sepa-instant-credit-transfer> Zugriff 2022-03-11.
Nguyen, Chi Nhan, Zeigermann, Oliver (2021): Machine Learning kurz & gut, 2. Aufl., Heidelberg: O ́Reilly.
Shalev-Shwartz, Shai, Ben-David, Shai (2014): Understanding Machine Learning. From Theory to Algorithm, New York: Cambridge University Press.
Autoren: Pascal Böhm (Masterstudent), Dr. Christof Altmann (FOM Dozent), Dr. Patrick Hedfeld (FOM Dozent))
www.fom.de