Imagen 2: Ein beeidruckendes KI-Bild-Update für Bard
Zuletzt aktualisiert am 13. September 2024 von Lars Weidmann
Die Welt der Kreativität erlebt durch KI-gestützte Modelle wie Lyria, Codey und Imagen eine Revolution. Diese Technologien ermöglichen es Nutzern, mit einfachen Worten oder Phrasen Bilder zu erzeugen, Coding-Hilfe zu erhalten oder Musik zu komponieren. Seit der Einführung von Imagen letztes Jahr hat sich diese Technologie als wertvolles Werkzeug für Privatpersonen und Unternehmen etabliert, um ihre kreativen Visionen Wirklichkeit werden zu lassen.
Mit Imagen können Nutzer nun direkt in Google-Produkten wie der Suchgenerierungs-Erfahrung (SGE) oder in Google Slides und Meet mit Duet AI in Workspace ihre Vorstellungen visualisieren. Darüber hinaus profitieren Entwickler und Unternehmen wie Canva und Snap von der Imagen API auf Google Cloud Vertex AI, um Millionen von Nutzern zu mehr Kreativität zu verhelfen.
Die Einführung im Dezember brachte eine verbesserte Qualität und Fotorealismus in die Bildgenerierung. Nun erweitert Imagen 2 seine Funktionen auf Bard und ImageFX, um neue Möglichkeiten der Bildgenerierung zu bieten.
Imagen 2 und Google DeepMind: Ein Schritt nach vorn in der Bildgenerierung
Imagen 2 basiert auf den neuesten Fortschritten von Google DeepMind im Bereich der Text-zu-Bild-Modelle und nutzt ein diffusionsbasiertes Modell. Diese Aktualisierung liefert hochwertigere Bilder und verbessert die Darstellung realistischer Hände und Gesichter sowie die Reduzierung von visuellen Störungen.
Die Genauigkeit bei der Verarbeitung von Details und die Fähigkeit, Nuancen besser einzufangen, sind signifikant gestiegen. Dadurch werden über verschiedene Stile und Anwendungsfälle hinweg fotorealistischere Bilder erzeugt.
Erweiterte Verfügbarkeit und neue Funktionen
Imagen 2 ist jetzt in Bard, ImageFX, SGE und auf Vertex AI verfügbar. Bard unterstützt Nutzer dabei, Ideen zu visualisieren, sei es beim Design eines Flyers oder beim Erstellen von Bildern für einen Blogbeitrag. Die Bildgenerierung in Bard ist in den meisten Ländern und auf Englisch verfügbar.
Verantwortungsbewusste Entwicklung von Imagen 2
Die Sicherheit stand bei der Weiterentwicklung von Imagen 2 im Vordergrund. Investitionen in die Sicherheit der Trainingsdaten und technische Schutzmaßnahmen begrenzen problematische Inhalte. Alle mit Imagen 2 generierten Bilder, werden mit SynthID markiert. Dieses von Google DeepMind entwickelte Werkzeug fügt ein digitales Wasserzeichen in die Pixel der Bilder ein, das für das menschliche Auge unsichtbar, aber zur Identifikation nachweisbar ist.