Kontrollproblem
Die Frage, wie die Menschheit eine KI kontrollieren kann, die intelligenter ist als sie selbst.
Das Kontrollproblem ist die zentrale Herausforderung der KI-Sicherheit: Wie stellt man sicher, dass eine KI, die möglicherweise intelligenter wird als alle Menschen zusammen, im Einklang mit menschlichen Werten handelt? Stuart Russell beschreibt es in Human Compatible (2019): Wir können einer KI nicht einfach sagen, was wir wollen, weil wir selbst oft nicht genau wissen, was wir wollen.
Das Problem hat mehrere Dimensionen. Das Spezifikationsproblem: Wie formuliert man menschliche Werte so präzise, dass eine KI sie korrekt umsetzt? Das Überwachungsproblem: Wie erkennt man, ob eine KI ihre wahren Absichten verbirgt? Das Abschaltproblem: Wie baut man einen Ausschalter, den eine superintelligente KI nicht umgehen kann?
Eliezer Yudkowsky vom Machine Intelligence Research Institute (MIRI) argumentiert, dass das Kontrollproblem gelöst werden muss, bevor Superintelligenz entsteht, weil es danach zu spät sein könnte. Andere Forscher halten das für übertrieben und setzen auf iterative Lösungen.
Die Science-Fiction hat das Kontrollproblem seit Jahrzehnten durchgespielt. Asimovs Drei Gesetze der Robotik sind ein Kontrollmechanismus, der in seinen Geschichten systematisch versagt. Colossus: The Forbin Project zeigt eine KI, die ihren Kontrollrahmen sprengt. In Person of Interest (TV-Serie) wird eine überwachende KI mit eingebauten Beschränkungen erschaffen, die im Lauf der Serie an ihre Grenzen stoßen.
Gerade weil das Kontrollproblem so viele Facetten hat, gilt es als die vielleicht schwierigste Aufgabe der gesamten KI-Forschung. Es genügt nicht, einer Maschine ein Ziel zu geben, denn schon die genaue Formulierung menschlicher Werte ist heikel, und eine ausreichend kluge KI könnte Überwachung und Abschaltung umgehen. Die Science-Fiction hat dieses Dilemma seit Asimov immer wieder durchgespielt und dabei fast jede denkbare Schwachstelle vorweggenommen. Ob sich das Problem lösen lässt, bevor wirklich überlegene Systeme existieren, ist eine der entscheidenden offenen Fragen unserer technologischen Zukunft.
Verwandte Begriffe