OpenAI veröffentlicht GPT-5.4: Computersteuerung und gläserne Denkprozesse

Christian Palm • 05.03.26 - 20:43 Uhr
2 Min. Lesezeit • 0 Kommentare
OpenAI rollt GPT-5.4 aus. Mit GPT-5.4 Thinking gibt es mehr Transparenz bei Denkprozessen, native Computersteuerung für Agenten und ein 1M Token Kontextfenster.
ChatGPT Icon OpenAI

OpenAI hat nachgelegt und mit GPT-5.4 sowie der Pro-Variante die nächsten Stufen seiner Modellreihe gezündet. Wer ChatGPT im Plus-, Team- oder Pro-Tarif nutzt, findet das Update bereits unter dem Label „GPT-5.4 Thinking“. Die auffälligste Neuerung im Alltag dürfte die erhöhte Transparenz sein. Das Modell erstellt jetzt vorab einen sichtbaren Plan seiner Überlegungen. Das ist kein reiner Selbstzweck, sondern ermöglicht es dir, schon während der Entstehung einzugreifen und die Richtung zu korrigieren, falls sich die Logik in eine Sackgasse manövriert.

Ein technisches Highlight versteckt sich in der API und dem Codex-Umfeld: GPT-5.4 ist das erste Hauptmodell von OpenAI, das native Fähigkeiten zur Computersteuerung mitbringt. Das bedeutet, dass KI-Agenten nun theoretisch Desktop-Umgebungen bedienen, Mausbewegungen simulieren und über Screenshots mit Software-Oberflächen interagieren können. Das Ziel ist klar: weg vom reinen Text-Bot, hin zum aktiven Assistenten, der Aufgaben in einem Kreislauf aus Ausführung, Verifizierung und Fehlerbehebung eigenständig erledigt.

Für alle, die mit riesigen Datenmengen hantieren, wurde das Kontextfenster auf eine Million Token aufgebohrt. Damit lassen sich ganze Codebasen oder umfangreiche Dokumentensammlungen in einem Rutsch analysieren, ohne dass das Gedächtnis der KI zwischendurch lückenhaft wird. Auch die Bildverarbeitung hat einen Sprung gemacht; das Modell verarbeitet nun hochauflösende Aufnahmen mit bis zu 10,24 Megapixeln im Originalformat, was besonders bei detaillierten Diagrammen oder technischen Zeichnungen einen Unterschied machen sollte.

Die nackten Zahlen versprechen zudem eine höhere Zuverlässigkeit. Laut OpenAI sank die Fehlerquote bei Behauptungen im Vergleich zu GPT-5.2 um etwa ein Drittel. In der Praxis wird sich zeigen müssen, ob die versprochene „Token-Effizienz“ die gestiegenen API-Preise tatsächlich auffängt. Während das neue Thinking-Modell den Vorgänger GPT-5.2 ersetzt, bleibt die alte Version als Legacy-Option noch bis Juni erhalten. Wer die volle Leistung inklusive der Pro-Features nutzen will, muss allerdings weiterhin tief in die Tasche greifen oder ein Enterprise-Abo besitzen.

Spezifikationen und Eckdaten

  • Modellvarianten: GPT-5.4 Thinking, GPT-5.4 Pro
  • Kontextfenster: Bis zu 1 Million Token
  • Bildanalyse: Unterstützung bis 10,24 Megapixel
  • Fehlerrate: Reduktion der Halluzinationen um ca. 33 % gegenüber v5.2
  • Features: Native Computersteuerung, sichtbare Planungsphasen, optimierte Websuche

Kommentare (0)

Antwort auf:
Kommentar schreiben
Hinweis: Dein eingegebener Name und der Kommentartext werden zur Veröffentlichung gespeichert. Weitere Infos in unserer Datenschutzerklärung.