“Voice Engine”: OpenAI stellt neues, bahnbrechendes KI-Produkt vor
Zuletzt aktualisiert am 13. September 2024 von Lars Weidmann
OpenAI, bekannt für seine Innovationen im Bereich der künstlichen Intelligenz, hat kürzlich seine neueste Errungenschaft vorgestellt: Voice Engine. Diese bahnbrechende Plattform zur Sprachgenerierung ermöglicht es, eine synthetische Stimme zu erschaffen, die basierend auf einer 15-sekündigen Sprachaufnahme einer Person Texte vorlesen kann. Doch was bedeutet diese Technologie für verschiedene Industriezweige, und wie geht OpenAI mit den damit verbundenen Herausforderungen um?
Eine neue Ära in der Sprachtechnologie
Voice Engine ist nicht nur in der Lage, Texte in der Sprache des ursprünglichen Sprechers vorzulesen, sondern kann dies auch in einer Reihe anderer Sprachen tun. Diese Fähigkeit eröffnet neue Möglichkeiten für Unternehmen und Bildungseinrichtungen. Zu den ersten, die Zugang zu dieser Technologie erhalten haben, gehören unter anderem das EdTech-Unternehmen Age of Learning und die visuelle Storytelling-Plattform HeyGen. Age of Learning nutzt beispielsweise Voice Engine, um vorgefertigte Sprachinhalte zu generieren und in Echtzeit personalisierte Antworten für Schüler zu erstellen, die von GPT-4 verfasst wurden.
Verantwortungsbewusster Umgang mit AI-Technologie
Inmitten der Begeisterung für die neuen Möglichkeiten wirft die Technologie auch wichtige ethische Fragen auf. OpenAI hat klare Richtlinien für den Einsatz von Voice Engine festgelegt. Partnerunternehmen müssen beispielsweise das explizite und informierte Einverständnis des Originalsprechers einholen und dürfen die Technologie nicht nutzen, um Personen oder Organisationen ohne deren Zustimmung zu imitieren. Zudem müssen sie den Zuhörern offenlegen, dass es sich bei den Stimmen um AI-generierte handelt. Zusätzlich hat OpenAI Wasserzeichen in die Audiodateien integriert, um deren Ursprung nachverfolgen zu können.
Diese Maßnahmen spiegeln ein wachsendes Bewusstsein für die Notwendigkeit wider, den ethischen Umgang mit AI-Technologien sicherzustellen. Sie kommen zu einer Zeit, in der die US-Regierung Maßnahmen ergreift, um den unethischen Einsatz von AI-Stimmtechnologie zu unterbinden, wie das kürzliche Verbot von Robocalls, die AI-klonierte Stimmen nutzen, zeigt.