Bias in KI
Systematische Verzerrungen in KI-Systemen, die zu unfairen oder fehlerhaften Ergebnissen führen.
Bias (Verzerrung) in KI-Systemen entsteht, wenn die Trainingsdaten, der Algorithmus oder die Designentscheidungen systematische Fehler enthalten. Es gibt mehrere Arten: Daten-Bias (die Trainingsdaten sind nicht repräsentativ), Selection Bias (bestimmte Gruppen fehlen in den Daten), Confirmation Bias (das System bestätigt vorhandene Annahmen) und Measurement Bias (die gemessenen Größen bilden die Realität verzerrt ab).
Bekannte Fälle gibt es viele. Googles Bilderkennung klassifizierte 2015 dunkelhäutige Menschen als Gorillas. Amazons Rekrutierungstool benachteiligte Frauen. Gesichtserkennungssysteme funktionieren bei weißen Männern deutlich besser als bei anderen demografischen Gruppen, wie Joy Buolamwinis Studie Gender Shades (2018) zeigte.
Das Problem ist grundlegend: KI-Systeme lernen die Welt, wie sie ist, nicht wie sie sein sollte. Wenn historische Daten Diskriminierung enthalten, lernt die KI diese Diskriminierung. Das macht Bias nicht zu einem technischen Fehler, der sich einfach beheben lässt, sondern zu einem Abbild gesellschaftlicher Realitäten in technischen Systemen.
In der Science-Fiction werden die Folgen vorurteilsbeladener Systeme in Gattaca (1997) durchgespielt, wo genetische Bewertung zu einer neuen Form der Diskriminierung führt, die technisch objektiv erscheint, aber zutiefst unfair ist.
Joy Buolamwinis Gender Shades-Studie (2018) war ein Wendepunkt in der öffentlichen Wahrnehmung des Problems. Sie testete kommerzielle Gesichtserkennung von Microsoft, IBM und Face++ und zeigte, dass die Fehlerrate für dunkelhäutige Frauen bis zu 35 Prozentpunkte höher war als für hellhäutige Männer. Das war kein Versagen der Algorithmen im technischen Sinn, die Algorithmen taten genau das, wofür sie trainiert wurden. Das Versagen war in den Trainingsdaten, die die Welt, wie sie ist, nicht wie sie sein sollte, abgebildet hatten.
Mit dem Aufstieg von Large Language Models (LLMs) hat Bias eine neue Dimension bekommen. Sprachmodelle, die auf Millionen von Texten trainiert werden, spiegeln die Vorurteile, Stereotype und blinden Flecken dieser Texte wider. Das umfasst politische Bias, kulturelle Annahmen und stereotypische Assoziationen, die sich in der Ausgabe der Modelle zeigen, ohne dass die Modelle sich dessen bewusst sind. Debiasing-Methoden existieren, aber sie sind imperfekt und können neue, schwerer sichtbare Verzerrungen erzeugen.
Für SF-Autoren ist Bias in KI ein dankbares Thema, weil es die Illusion von Objektivität entlarvt. Ein System, das 'objektiv' Risiken berechnet oder 'neutral' Bewerber bewertet, trägt immer die Werturteile seiner Schöpfer in sich. Das ist eine mächtige erzählerische Idee: Technologie nicht als neutrales Werkzeug, sondern als geronnene gesellschaftliche Entscheidung.
Verwandte Begriffe