a cell phone sitting on top of a laptop computer

„Voice Engine“: OpenAI stellt neues, bahnbrechendes KI-Produkt vor

1. April 2024 Luca Koch

Zuletzt aktualisiert am 13. September 2024 von Lars Weidmann

OpenAI, bekannt für seine Innovationen im Bereich der künstlichen Intelligenz, hat kürzlich seine neueste Errungenschaft vorgestellt: Voice Engine. Diese bahnbrechende Plattform zur Sprachgenerierung ermöglicht es, eine synthetische Stimme zu erschaffen, die basierend auf einer 15-sekündigen Sprachaufnahme einer Person Texte vorlesen kann. Doch was bedeutet diese Technologie für verschiedene Industriezweige, und wie geht OpenAI mit den damit verbundenen Herausforderungen um?

Eine neue Ära in der Sprachtechnologie

Voice Engine ist nicht nur in der Lage, Texte in der Sprache des ursprünglichen Sprechers vorzulesen, sondern kann dies auch in einer Reihe anderer Sprachen tun. Diese Fähigkeit eröffnet neue Möglichkeiten für Unternehmen und Bildungseinrichtungen. Zu den ersten, die Zugang zu dieser Technologie erhalten haben, gehören unter anderem das EdTech-Unternehmen Age of Learning und die visuelle Storytelling-Plattform HeyGen. Age of Learning nutzt beispielsweise Voice Engine, um vorgefertigte Sprachinhalte zu generieren und in Echtzeit personalisierte Antworten für Schüler zu erstellen, die von GPT-4 verfasst wurden.

Siehe auch Apple: Faltbare MacBooks könnten schon 2026 erscheinen

Verantwortungsbewusster Umgang mit AI-Technologie

Inmitten der Begeisterung für die neuen Möglichkeiten wirft die Technologie auch wichtige ethische Fragen auf. OpenAI hat klare Richtlinien für den Einsatz von Voice Engine festgelegt. Partnerunternehmen müssen beispielsweise das explizite und informierte Einverständnis des Originalsprechers einholen und dürfen die Technologie nicht nutzen, um Personen oder Organisationen ohne deren Zustimmung zu imitieren. Zudem müssen sie den Zuhörern offenlegen, dass es sich bei den Stimmen um AI-generierte handelt. Zusätzlich hat OpenAI Wasserzeichen in die Audiodateien integriert, um deren Ursprung nachverfolgen zu können.

Diese Maßnahmen spiegeln ein wachsendes Bewusstsein für die Notwendigkeit wider, den ethischen Umgang mit AI-Technologien sicherzustellen. Sie kommen zu einer Zeit, in der die US-Regierung Maßnahmen ergreift, um den unethischen Einsatz von AI-Stimmtechnologie zu unterbinden, wie das kürzliche Verbot von Robocalls, die AI-klonierte Stimmen nutzen, zeigt.

Siehe auch Spotify erweitert seine Hörbuchbibliothek

Autor

Luca Koch

Luca Koch ist als Redakteur für das Magazin Elektronik Informationen tätig und hat sich auf das Thema Künstliche Intelligenz spezialisiert, schreibt jedoch auch über andere Technik-Themen.
Alle Beiträge ansehen