KI-System lernt durch Bestrafung und Belohnung

KIForscher des chinesischen Suchmaschinenriesen Baidu nutzen Modelle der Belohnungen und Bestrafungen, um KI-Systeme zu trainieren. Jedes Mal, wenn eine Künstliche Intelligenz (KI) im virtuellen 2D-Labyrinth an einer Wand anstieß, wurde das System bestraft. Konnte ein Objekt hingegen erfolgreich lokalisiert werden, folgte eine Belohnung.

Der virtuelle Agent hat nicht nur mit einem Begriff verknüpfte Gegenstände erkannt, sondern entwickelte auch ein grundlegendes Verständnis für Grammatik.

Anzeige

Wissen wird kombiniert

“Bei diesem Ansatz handelt es sich um ein behavioristisches Lernmodell, wie es in den 1950er-Jahren noch üblich war. Vor allem im menschlichen Kontext könnte man daher anmerken, dass diese Vorgehensweise etwas überholt erscheint”, erläutert Peter Purgathofer vom Institut für Gestaltungs- und Wirkungsforschung der TU Wien gegenüber pressetext.

Den Forschern zufolge ist die Durchführung einer neuen Aufgabe für Menschen leicht, während KI-Systeme noch Probleme damit haben. Obwohl diese beispielsweise wissen, wie eine Drachenfrucht aussieht, können sie den Befehl “Schneide die Drachenfrucht mit einem Messer!” erst ausführen, wenn sie mit einem Datensatz trainiert worden sind, der exakt diese Anweisung enthält. Im Gegensatz dazu hat der virtuelle Agent in den Versuchen demonstriert, dass er das Wissen um die Erscheinung einer Drachenfrucht sowie die Aufgabe “Schneide X mit einem Messer!” erfolgreich miteinander verbunden hat, ohne explizit mit diesem Befehl trainiert worden zu sein.

3D-Umgebung geplant

Die Forschungsergebnisse zeigen, dass Algorithmen Sprache und Navigation zeitgleich lernen und dieses Wissen in ähnlicher Weise wie Menschen anwenden können. Die Wissenschaftler hoffen, dass sie ihre Studie schon bald auf eine 3D-Umgebung übertragen können. Obwohl es sich hierbei um einen simplen Forschungsansatz handelt, stellt er unter Beweis, dass KI-Systeme ihr Wissen ähnlich wie Menschen für verschiedene Tätigkeiten einsetzen können, ohne im Vorfeld mit der spezifischen Aufgabenstellung konfrontiert worden zu sein.

Anzeige

www.pressetext.com
 

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.