OpenAI-Tool erzeugt jetzt auch Video aus Textvorgaben

Die Macher des Chatbots ChatGPT schließen eine Lücke in ihrem Angebot mit einer Software, die Videos aus Textvorgaben erzeugen kann. Das KI-Modell mit dem Namen Sora werde zunächst ausgewählten Kreativen zur Verfügung gestellt, schrieb OpenAI-Chef Sam Altman gestern auf der Onlineplattform X (Twitter). Auch sollen Fachleute mögliche Sicherheitsrisiken ausloten, bevor das Programm breit genutzt werden kann.

Von Sora erstellte Videos können bis zu eine Minute lang sein. Auf der Website zur Software veröffentlichte OpenAI mehrere Beispiele zusammen mit der Beschreibung, die ihnen zugrunde lag. Eines davon etwa zeigt eine Frau, die durch eine Straße geht.

Ein von einer KI erzeugter Videograb zeigt eine Frau in einer Straße in Tokio
APA/AFP/Stefano Rellandini

Das Video wurde komplett von KI generiert, mit der Textvorgabe, die Frau solle eine Lederjacke und ein rotes Kleid tragen, und die Straße solle an Tokio erinnern und viel Neonleuchtreklame haben, die sich zudem in Lacken spiegle. Andere Videos zeigen unter anderem Mammuts, die im Schnee gehen, sowie eine Stadt in Kalifornien zu Zeiten des Goldrauschs.

OpenAI verweist auf Schwächen

Mehrere andere Unternehmen entwickelten bereits Software, die Videos aus Text erzeugen kann. OpenAI schränkt ein, dass Sora noch Schwächen habe: So mache das Modell manchmal Fehler bei der Umsetzung von Physikregeln. Auch könne es zum Beispiel passieren, dass jemand im Video von einem Keks abbeiße – und das Keks später immer noch ganz aussehe.

KI-Technologie, die bewegte Bilder aus Textvorgaben erzeugt, könnte mit der Zeit die Videoproduktion verändern. Zugleich sind die Sorgen groß, dass damit in großem Stil Fake-Videos erzeugt werden können, die von echten Aufnahmen kaum zu unterscheiden wären.

Die Entwickler der Technologie arbeiten deshalb an Wegen, in die Videos eindeutige Erkennungsmerkmale wie Wasserzeichen einzubauen. Auch bei Sora-Videos solle erkennbar sein, dass sie von KI erzeugt wurden.