Die US-Mikroblogging-Plattform Twitter plant einen „Safety Mode“, der für individuelle User automatisch Accounts von Cybermobbern blockiert.
Aktivieren Anwender das Tool, sperrt die Künstliche Intelligenz (KI) der Plattform alle Postings, die Beleidigungen oder Hasskommentare enthalten.
„KI ist radikaler als Mensch“
„Der Ansatz einer technologischen Lösung für das Problem des Cybermobbings ist nicht von der Hand zu weisen. Aber ein kompletter Schutz ist nicht garantiert. Algorithmen werden zwar immer genauer, können jedoch oft nicht zwischen den Zeilen lesen. Sie neigen auch dazu, deutlich radikaler und undifferenzierter zu sein als Menschen. Auch ist Transparanz dabei wichtig, wer die KI programmiert hat und ob sie dadurch befangen ist“, gibt Matthias Jax, Projektleiter bei Saferinternet, gegenüber pressetext zu bedenken.
User sollen laut Twitter selbst entscheiden können, ob sie den Safety Mode aktivieren oder nicht. Der Algorithmus achtet vor allem auf bestimmte Schlüsselwörter, die mit Cybermobbing in Verbindung stehen. Darunter sind Schimpfwörter und beleidigende Ausdrücke. Ist ein Account gegenüber Usern bösartig, blockiert das System dessen Bemerkungen für den Zeitraum von sieben Tagen.
Benachrichtigung bei Sperre
Jedes Mal, wenn die Twitter-KI einen Account blockiert, erhalten Anwender eine entsprechende Benachrichtigung. Der Plattform zufolge kann der Algorithmus mehr als 50 Prozent der Hasskommentare entdecken, bevor Nutzer diese melden. Jedoch kann eine KI hier oft Fehler machen.
www.pressetext.com