Rätselraten über neues KI-Modell „gpt2-chatbot“

Ein neues KI-Modell namens „gpt2-chatbot“ sorgt derzeit für Aufsehen. Bisher ist unklar, wer das Modell entwickelte und von wem es online gestellt wurde. Eine Vermutung lautet, es könne sich um eine Chatbot-Version des fünf Jahre alten GPT-2-Modells von OpenAI handeln. Allerdings zeigt das Modell erstaunliche Fähigkeiten, die sogar die neueren Modelle GPT-3 und GPT-4 übertreffen.

Einige mutmaßen, dass es sich um einen geheimen Test von OpenAI für eine neue Version wie GPT-4.5 oder GPT-5 handelt. Andere spekulieren über eine Verbindung zum mysteriösen Q-Projekt von OpenAI. Eine Möglichkeit wäre auch, dass ein unabhängiger Entwickler das Modell von OpenAI aufgegriffen und weiterentwickelt hat.

Erstaunliche Fähigkeiten, aber auch Fehler

Nutzerinnen und Nutzer, die mit dem Modell interagiert haben, waren überrascht von seinen Fähigkeiten wie der Generierung von Computercode, dem Lösen von Rechenaufgaben und dem Ziehen logischer Schlüsse. Allerdings seien gelegentlich auch Halluzinationen und Fehler aufgetreten.

Die Herkunft und Funktionsweise des Modells sind noch nicht geklärt, da es mittlerweile von der Plattform entfernt wurde, auf der es zugänglich war. Es handelte sich dabei um die LMSYS Chatbot Arena – eine Art weltweite Rangliste für aktuelle Sprachmodelle, inklusive der Möglichkeit, verschiedene Modelle auszuprobieren und miteinander zu vergleichen.

Als Grund führte LMSYS „unerwartet hohen Datenverkehr“ und Kapazitätsgrenzen an. Die Entfernung führte zu Kritik an LMSYS, schließlich sei die Transparenz bei solchen Modellen unerlässlich.