Kreative KI im Smartphone-Zeitalter: Wie funktioniert generative KI und was sind ihre Anwendungen?

9. Mai 2023 Marina Meier

Zuletzt aktualisiert am 9. Mai 2023 von Lars Weidmann

Generative KI-Systeme wie ChatGPT und Bildgeneratoren wie Midjourney haben in letzter Zeit für Aufsehen gesorgt. Sie sind fähig, kreative Aufgaben wie Zeichnen und Dichten zu bewältigen, bei denen Computer historisch betrachtet Schwierigkeiten hatten. Aber was hat den plötzlichen Boom in der generativen KI ausgelöst und wie funktioniert diese Technologie? Hier erfahren Sie alles, was Sie wissen müssen.

Inhaltsverzeichnis

Was ist generative KI?

Generative KI ist ein Sammelbegriff für Computerprogramme, die eigenständig Texte, Bilder, Videos und Audiodateien erstellen können.

Bisher waren die meisten KI-Systeme nicht besonders kreativ und lieferten weit schlechtere Ergebnisse als Menschen. Dies hat sich jedoch mit der generativen KI geändert. Zum Beispiel kann man ein generatives KI-Tool wie Bing Image Creator bitten, ein fotorealistisches Bild von einer “niedlichen blauen KI-Kreatur mit orangefarbenen Augen” zu erstellen, und es liefert die oben gezeigten Ergebnisse. Das betreffende Tool wurde nicht ausdrücklich darauf geschult oder trainiert, dieses Bild zu erstellen, hat aber dennoch ein beeindruckendes Ergebnis geliefert.

Generative KI-Tools sind immer leistungsfähiger geworden, mit neuen Entwicklungen, die alle paar Monate auf den Markt kommen. Die neueste Version eines KI-Bildgenerators hat sogar Experten getäuscht und einen renommierten Fotowettbewerb gewonnen. Ebenso sind mehrere von KI generierte Bilder in sozialen Medien viral gegangen, darunter einige mit politischer Agenda.

Ob Sie generative KI selbst nutzen möchten oder nicht, es ist wichtig zu wissen, dass sie existieren und welche ihre Grenzen sind. Glücklicherweise haben wir noch nicht den Punkt erreicht, an dem diese Tools perfekt sind. Tatsächlich neigen sie dazu, einige offensichtliche Fehler zu machen. Das bedeutet, dass Sie mit den richtigen Informationen und Schulungen zwischen realen und von KI generierten Inhalten unterscheiden können.

Wie funktioniert generative KI?

Generative KI fällt in die Kategorie des maschinellen Lernens, einem Oberbegriff für Computer-Algorithmen, die große Datenmengen analysieren. Diese Algorithmen sind darauf ausgelegt, menschenähnliche Arbeitsweisen nachzuahmen.

Siehe auch KI-gestützte Reiseplanung: Mit ChatGPT Ihre nächste Reise auf Booking.com organisieren

Erkennen von Mustern in Daten

Der erste Schritt besteht darin, Muster aus vorhandenen Daten zu extrahieren. Wenn Sie also eine KI möchten, die neue Gesichter erzeugen kann, würden Sie einen Datensatz mit Bildern von Gesichtern einspeisen. Mit genügend Training lernt der Algorithmus, wie ein Gesicht aussieht, sowie gemeinsame Merkmale wie Nase, Augen, Ohren und Lippen. Von dort aus kann er sich auf kleinere Details wie Mimik, Gesichtsbehaarung und Hauttöne konzentrieren.

Ohne ausreichendes Training wird das maschinelle Lernmodell in unserem Beispiel keine Ergebnisse erzeugen, die wie ein menschliches Gesicht aussehen. Tatsächlich ist dieses Problem derzeit bei KI-Bildgenereratoren wie Midjourney aktuell. Experten konnten fiktive Bilder von Papst Franziskus durch sorgfältige Untersuchung der auf dem Bild sichtbaren Finger schnell erkennen. Da Fotos von Menschen, die Gegenstände halten, keine vollständigen Finger zeigen, können generative KI-Algorithmen Schwierigkeiten haben, genügend Informationen aus den Trainingsdaten zu sammeln.

Transformer und bestärkendes Lernen

Viele der modernen generativen KI-Tools, von denen Sie möglicherweise gehört haben, wie ChatGPT, basieren auf der Transformer-Architektur. Diese ermöglicht es dem Algorithmus, sich auf Beziehungen innerhalb der Daten zu konzentrieren. Bei einem großen Sprachmodell wie GPT-3 beispielsweise werden Vorhersagen darüber getroffen, welches Wort als nächstes wahrscheinlich erscheint.

Ein weiteres häufig in der generativen KI verwendete Verfahren ist das bestärkende Lernen. Vereinfacht gesagt, bewertet ein Mensch manuell die Ausgabe eines Modells, um schlechte Antworten herauszufiltern und den Algorithmus in eine bestimmte Richtung zu lenken. Dank einer öffentlichen Forschungsarbeit zum LaMDA-Sprachmodell wissen wir, dass Google Teilzeitmitarbeiter für bestärkendes Lernen einstellte. Im Laufe der Zeit half ihr Feedback dem Modell, qualitativ hochwertige und nützliche Antworten auf Benutzeraufforderungen zu liefern.

Vor- und Nachteile der generativen KI

Wie bei jeder neuen Technologie gibt es sowohl kreative als auch missbräuchliche Anwendungen. Hier sind einige Vorteile der generativen KI:

Reduzierte manuelle Arbeit: Bei Aufgaben mit viel Wiederholung kann die generative KI die Belastung mit wenig bis gar keinem Aufwand verringern. Beispielsweise enthält Computercode viel Standardtext. Ein Entwickler kann mit Hilfe eines Chatbots die meisten der anfänglichen Schritte automatisieren.
Erhöhte Effizienz: Computer können große Mengen an Informationen deutlich schneller verarbeiten als Menschen. Ein Sprachmodell kann zum Beispiel schnell ein langes Dokument oder eine wissenschaftliche Arbeit zusammenfassen und Fragen beantworten, die kritisches Denken erfordern.
Menschliche Entscheidungsfindung: Generative KI kann sehr gut mit neuen und unbekannten Szenarien umgehen, was bedeutet, dass sie auch bei der Entscheidungsfindung hervorragend abschneiden könnte. GPT-4 kann beispielsweise bereits standardisierte Tests bestehen, die für Hochschulabsolventen konzipiert sind, und komplexe mathematische Probleme lösen.

Siehe auch Google Bard beurteilt iOS und Android: Welches Betriebssystem zieht das KI-Assistent vor?

Es gibt jedoch auch viele Nachteile bei generativen KI-Tools. Wir haben bereits einen eigenen Beitrag über die Gefahren von KI, aber hier ist eine kurze Zusammenfassung:

Voreingenommenheit: Wie bereits erwähnt, funktionieren generative KI-Tools erst nach ausreichendem Training gut. Leider sind jedoch unzählige Variationen in der realen Welt vorhanden, sodass eine unvoreingenommene oder perfekte KI heute noch außer Reichweite ist. Eine KI, die beispielsweise dazu entwickelt wurde, Stellenbewerber auszuwählen, könnte unbeabsichtigt aufgrund von Schulungsvoreingenommenheiten nach bestimmten Rassen oder Geschlechtern auswählen.

Bösartige Handlungen: Von Hobbyprogrammierern, die ChatGPT nutzen, um Schadsoftware zu generieren, bis hin zu Social-Media-Nutzern, die Deepfake-Bilder von Politikern erstellen – generative KI-Tools können die breite Öffentlichkeit mit wenig Aufwand schädigen oder in die Irre führen.
Arbeitsplatzverlust: Die generative KI hat das Potenzial, einige Arbeitsplätze überflüssig zu machen oder zumindest die Nachfrage nach Personal zu reduzieren. Dies gilt insbesondere in der Kunstbranche, wo ein einziger textbasierter Befehl fast augenblicklich Bilder erzeugen kann. Ein geschulter Mensch kann dann in kurzer Zeit die KI-generierte Kunst verfeinern, anstatt sie von Grund auf neu zu erstellen.

Beispiele für generative KI

In diesem Artikel haben wir bereits einige Beispiele für generative KI behandelt. Wir können sie jedoch auch anhand ihrer Rolle gruppieren:

Text und Dialog: Chatbots wie ChatGPT, Bing Chat und Google Bard fallen in diese Kategorie. Sie wurden darauf trainiert und optimiert, sich an Gesprächen zu beteiligen, was sie perfekt für Aufgaben wie Forschung und Kundensupport macht.
Bild und Video: KI-Bildgeneratoren wie Midjourney, DALL-E und Stable Diffusion können einige Wörter in Kunstwerke umwandeln. Sie können auch mit vorhandenen Bildern arbeiten, um Hintergründe auszutauschen, Elemente hinzuzufügen oder zu mischen und vergrößerte Kopien von Bildern mit niedriger Qualität zu erstellen.
Sprache und Audio: Unternehmen wie Google arbeiten daran, generative KI zur Sprachsynthese einzusetzen. Vielleicht sind Sie bereits mit dem WaveNet-Text-zu-Sprache-Modell vertraut, da es für den Google Assistant verwendet wird. Aber das ist noch nicht alles: Andere generative KIs wie OpenAI Jukebox können auch Musik mit Instrumenten und Gesang in bestimmten Genres und Stilen kreieren.
Code: Was wäre, wenn Computer ihre eigenen Programme schreiben könnten? Noch sind wir nicht ganz so weit, aber Programmierer können bereits KI-Helfer wie GitHub Copilot oder OpenAI Codex verwenden, um ihre Arbeitsabläufe zu beschleunigen.

Siehe auch Explosives Wachstum: Diese KI-Website ist auf dem Weg, 1 Milliarde monatliche Nutzer zu knacken

Es ist erwähnenswert, dass die meisten dieser generativen KI-Tools vor einigen Jahren noch gar nicht existierten. Mit scheinbar jede zweite Woche neuen Durchbrüchen ist es unmöglich, die Zukunft vorherzusagen.

Zusammenfassend lässt sich sagen, dass generative KI eine beeindruckende und sich schnell entwickelnde Technologie ist, die sowohl großes Potenzial als auch einige ernsthafte Herausforderungen mit sich bringt. Während sie in vielen Bereichen menschenähnliche Fähigkeiten aufweisen kann, ist es wichtig, sich ihrer Einschränkungen bewusst zu sein und darauf vorbereitet zu sein, dass sie sowohl zum Nutzen als auch zum Missbrauch eingesetztwerden kann. Es liegt an uns, die Technologie verantwortungsbewusst einzusetzen und uns stets über die neuesten Entwicklungen und möglichen Gefahren im Bereich der generativen KI zu informieren.

Insgesamt zeigt sich, dass generative KI eine faszinierende Zukunft vor sich hat. Mit jedem Durchbruch werden die Anwendungsmöglichkeiten dieser Technologie erweitert, und es ist nur eine Frage der Zeit, bis sie in nahezu allen Bereichen unseres Lebens integriert ist. Wir müssen jedoch auch wachsam sein, um sicherzustellen, dass diese Entwicklungen ethisch und verantwortungsbewusst vorangetrieben werden, um sowohl den Nutzen als auch die potenziellen Gefahren dieser bahnbrechenden Technologie zu bewältigen.