Large Language Model
Riesige KI-Sprachmodelle, die Texte verstehen und erzeugen, indem sie Milliarden von Textbeispielen statistisch verarbeiten.
Large Language Models (LLMs) sind neuronale Netze mit Milliarden von Parametern, die auf gewaltigen Textmengen trainiert werden. Sie lernen die statistische Struktur von Sprache: welche Wörter in welchem Kontext wahrscheinlich aufeinander folgen. GPT, Claude, LLaMA und Gemini sind bekannte Beispiele.
Die Fähigkeiten von LLMs überraschen selbst Forscher. Sie übersetzen, fassen zusammen, programmieren, analysieren und führen Gespräche auf einem Niveau, das vor 2020 für unmöglich gehalten wurde. Gleichzeitig haben sie fundamentale Schwächen: Sie können faktenwidrige Aussagen mit großer Überzeugung formulieren (Halluzinationen), verstehen keinen physischen Kontext und haben kein dauerhaftes Gedächtnis zwischen Gesprächen.
In der Science-Fiction vorhergesagt wurde diese Technologie erstaunlich selten. Die meisten fiktiven KI-Systeme denken logisch und regelbasiert. Dass eine KI funktioniert, indem sie Sprache statistisch modelliert, ist ein Konzept, das sich weder HAL 9000 noch Data noch Cortana zuschreiben lassen. LLMs sind damit ein seltener Fall, in dem die Realität einen Weg eingeschlagen hat, den die Science-Fiction kaum antizipiert hat.
Gerade darin liegt das Faszinierende an den großen Sprachmodellen: Die Realität hat eine Form von Maschinenintelligenz hervorgebracht, die kaum eine Science-Fiction vorhergesehen hat. Statt kühl und logisch zu schlussfolgern, erzeugen LLMs Sprache durch Wahrscheinlichkeit und wirken dabei oft kreativ, manchmal aber auch überzeugend falsch. Das wirft neue Fragen auf, die das Genre erst nachträglich aufgreift: Was bedeutet es, mit einer Maschine zu sprechen, die Sprache beherrscht, ohne die Welt dahinter wirklich zu verstehen? Die großen Sprachmodelle sind damit ein lebendiges Beispiel dafür, dass die Zukunft selten genau so eintrifft, wie die Fiktion sie ausmalt.
Verwandte Begriffe