ChatGPT soll künftig auch sprechen und sehen können

Bisher konnten sich Nutzerinnen und Nutzer nur per Tastatur mit dem Chatbot ChatGPT unterhalten, künftig könnte ein richtiges Gespräch möglich sein. Dafür soll das Programm nach einem Update auf Spracheingaben und hochgeladene Fotos reagieren, wie die Entwicklerfirma der künstlichen Intelligenz (KI), OpenAI, gestern mitteilte.

Die neue Technologie öffne Türen zu vielen kreativen und auf Barrierefreiheit ausgerichteten Anwendungen, hieß es. Das Angebot soll zunächst nur für kostenpflichtige Versionen des Programms verfügbar sein.

Nutzerinnen und Nutzer könnten „bei einer Reise ein Foto knipsen“, es auf die Plattform laden und sich dann über Besonderheiten der Gegend unterhalten, erklärte das Unternehmen. Auf Fotos des Kühlschrankinhalts könne die KI mit Rezeptvorschlägen reagieren, und selbst für Gutenachtgeschichten lasse sich die Sprachfunktion des Programms nutzen.

Zusammenarbeit mit Synchronsprecherinnen

Für mehr Realismus in den Gesprächen arbeitete OpenAI den Angaben zufolge mit Synchronsprecherinnen und -sprechern zusammen. Die Funktionen sollen in den kommenden Wochen zunächst für ChatGPT-Plus- und Enterprise-Nutzerinnen und -Nutzer eingeführt werden und dann sowohl für Smartphones mit Apple-Betriebssystem als auch für Android-Geräte zur Verfügung stehen.

Zeitgleich kündigte der schwedische Streamingdienst Spotify an, die OpenAI-Technologie zu nutzen, um Podcasts in verschiedene Sprachen zu übersetzen. Dabei würden Stimme und Sprachstil der Originalversion beibehalten. Zunächst sollen englischsprachige Podcasts auf Spanisch, Französisch und Deutsch übersetzt werden.

Generative KI-Programme wie ChatGPT wurden der Öffentlichkeit erstmals vor knapp einem Jahr zugänglich gemacht. Sie sind beispielsweise in der Lage, Essays, Gedichte und Unterhaltungen aus sehr kurzen Eingabeaufforderungen der Nutzenden zu generieren.