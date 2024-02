Zuletzt aktualisiert am 27. Februar 2024 von Luca Koch

Google hat kürzlich Gemini erweitert, ein Set von KI-Werkzeugen, das aus Textanweisungen Bilder generiert. Doch die Technologie stieß schnell an ihre Grenzen, indem sie ungenaue und teilweise offensive Bilder produzierte. Die Frage stand im Raum: Wie konnte dies geschehen?

Technische und ethische Herausforderungen

Beim Entwurf der Text-zu-Bild-Funktion von Gemini zielte Google darauf ab, frühere Fehler der Bildgenerierung zu vermeiden, wie z.B. die Erstellung anstößiger Inhalte. Das Unternehmen strebte eine diversere und unvoreingenommene KI an. Doch die Resultate entsprachen nicht immer den Eingaben: Beispielsweise erzeugte die KI Bilder von Menschen verschiedener Hautfarben, auch wenn explizit nach weißen historischen Figuren gefragt wurde. Google identifizierte zwei Hauptprobleme: Die KI berücksichtigte nicht, welche Personen sie nicht zeigen sollte und agierte bei bestimmten Anfragen zu vorsichtig.

Der Weg nach vorne

Google hat die Generierung von Personenbildern in Gemini vorübergehend gestoppt, um die Fehler zu beheben. Das Unternehmen räumt ein, dass KI-“Halluzinationen” bei komplexen Modellen nicht neu sind und verspricht, an der Verbesserung zu arbeiten. Trotz der Herausforderungen ist das Ziel, die Technologie so zu verfeinern, dass sie den ursprünglichen Visionen entspricht.

Ein notwendiger Schritt

Die vorübergehende Pause von Gemini unterstreicht die Notwendigkeit, KI-Technologien ständig zu überprüfen und zu verbessern. Diese Episode lehrt uns, dass wir noch am Anfang der KI-Entwicklung stehen und jede Herausforderung als Chance zur Verbesserung betrachten sollten. Die Weiterentwicklung von Gemini verspricht, eine ausgereiftere und ethischere Technologie hervorzubringen.