Probleme mit neuer ChatGPT-Stimme „Sky“ – zu große Ähnlichkeit zu Scarlett Johansson
Zuletzt aktualisiert am 13. September 2024 von Lars Weidmann
OpenAI hat die Verwendung der Sky-Stimme in ChatGPT vorübergehend eingestellt, da Bedenken aufkamen, dass sie zu sehr der Stimme der Schauspielerin Scarlett Johansson aus dem Film „Her“ ähnelt. Das Unternehmen betont, dass die Stimmen in ChatGPT von bezahlten Synchronsprechern stammen. Aus einem ursprünglichen Pool von 400 Sprechern wurden fünf ausgewählt, und es sei reiner Zufall, dass die Schauspielerin hinter der Sky-Stimme einen ähnlichen Ton wie Johansson habe.
Einführung von GPT-4o und neue Funktionen
Die Bedeutung von Sprachfunktionen wird für OpenAI zunehmend wichtiger, da das Unternehmen das neue GPT-4o-Modell in ChatGPT einführt. Mit diesem Modell kommt eine völlig neue, konversationelle Benutzeroberfläche, die es den Nutzern ermöglicht, in Echtzeit mit einer natürlich klingenden und emotionale Reaktionen nachahmenden KI zu sprechen. Während die Sky-Stimme und eine Version von ChatGPT Voice schon seit einiger Zeit verfügbar sind, wurde die Ähnlichkeit zu Johansson durch den CEO von OpenAI, Sam Altman, und andere hervorgehoben. Im Film „Her“ spricht Scarlett Johansson ein fortschrittliches KI-Betriebssystem namens Samantha, das eine romantische Beziehung mit einem einsamen Schriftsteller, gespielt von Joaquin Phoenix, entwickelt. Die Fähigkeit von GPT-4o, emotionale Reaktionen zu imitieren, verdeutlichte diese Parallelen.
Multimodalität und Missbrauchsrisiken
GPT-4o unterscheidet sich von früheren Modellen und der vorherigen Version von ChatGPT Voice durch seine Multimodalität. Das bedeutet, dass es auf Bilder, Text, Videos und natürlich Sprache trainiert wurde und diese auch generieren kann. Anders als andere multimodale Modelle ermöglicht es Echtzeit-Gespräche und sogar eine emotionale und anpassbare Stimme. Aufgrund dieser verstärkten Emotionalität in der Stimme von ChatGPT Voice besteht das Risiko, dass sie missbraucht oder zur Erstellung von Deepfakes verwendet werden könnte. OpenAI zeigt Verständnis für mögliche Bedenken seitens Scarlett Johanssons Team, da die Stimmen tatsächlich sehr ähnlich klingen.
Derzeit sind fünf Stimmen für die aktuelle Version von ChatGPT Voice verfügbar: Breeze, Cove, Ember, Juniper und Sky. Diese Stimmen werden auch beim Start der neuen Version verwendet. OpenAI betont, dass sie mit den ausgewählten Synchronsprechern zusammengearbeitet, deren Stimmen lizenziert und für die App verwendet haben. Jeder Sprecher erhält eine Vergütung, die über den marktüblichen Sätzen liegt, und dies wird so lange fortgesetzt, wie ihre Stimmen in den Produkten verwendet werden.