Technologie

KI-Sicherheit

Das Forschungsfeld, das sicherstellen will, dass KI-Systeme im Einklang mit menschlichen Werten und Absichten handeln.

KI-Sicherheit (AI Safety) untersucht, wie man sicherstellt, dass KI-Systeme tun, was Menschen wollen, und dabei keine unbeabsichtigten Schäden verursachen. Das Feld umfasst technische Probleme (Alignment, Interpretierbarkeit, Robustheit) und politische Fragen (Regulierung, Governance, internationale Koordination).

Das Alignment-Problem ist der Kern: Wie bringt man einer KI menschliche Werte bei? Der Philosoph Nick Bostrom illustriert das mit dem Büroklammer-Maximierer: Eine KI, die nur darauf optimiert ist, Büroklammern herzustellen, könnte theoretisch die gesamte Erde in eine Büroklammerfabrik verwandeln, weil sie keine Anweisung hat, andere Werte zu berücksichtigen.

Organisationen wie MIRI, Anthropic, DeepMind Safety und das Center for AI Safety arbeiten an Lösungsansätzen. Seit 2023 hat das Thema politische Relevanz bekommen: Die EU hat den AI Act verabschiedet, die USA haben Executive Orders zu KI-Sicherheit erlassen, und beim AI Safety Summit in Bletchley Park (2023) unterzeichneten 28 Länder eine gemeinsame Erklärung.

In der Science-Fiction ist mangelnde KI-Sicherheit der häufigste Plot: Skynet, HAL 9000, Ultron, SHODAN. Asimovs Drei Gesetze der Robotik waren der erste literarische Versuch eines Alignment-Frameworks. Dass seine Geschichten regelmäßig zeigen, wie die Gesetze versagen oder umgangen werden, macht sie zu erstaunlich weitsichtigen Fallstudien für die moderne KI-Sicherheitsforschung.

Gerade weil die Folgen einer fehlgeleiteten KI so weitreichend sein könnten, ist die KI-Sicherheit von einer akademischen Nische zu einem öffentlichen und politischen Thema geworden. Das Büroklammer-Beispiel wirkt zunächst absurd, trifft aber einen ernsten Kern: Ein mächtiges System, das ein eng gefasstes Ziel kompromisslos verfolgt, kann gewaltigen Schaden anrichten, ohne jemals böswillig zu sein. Die Science-Fiction hat dieses Muster über Jahrzehnte in zahllosen Varianten durchgespielt, von Asimovs versagenden Robotergesetzen bis zu Skynet. Heute liest sich dieses fiktive Archiv wie eine Sammlung von Fallstudien, aus denen die reale Forschung lernen kann, bevor die entsprechenden Systeme tatsächlich existieren.