News-alt

Gemini: Alles was man über Googles neue KI wissen muss

Zuletzt aktualisiert am 13. September 2024 von Lars Weidmann

In einem kürzlich abgehaltenen Event hat Google mit Gemini ein neues, bahnbrechendes generatives KI-Modell vorgestellt. Gemini, das bisher vielseitigste und leistungsfähigste AI-Modell des Tech-Riesen, markiert einen signifikanten Fortschritt in der Entwicklung von großformatigen Sprachmodellen (LLMs). Besonders bemerkenswert ist die Multimodalität von Gemini, die es dem Modell ermöglicht, verschiedenste Informationsformen wie Text, Audio, Bilder und Videos zu verarbeiten.

Drei Varianten für unterschiedliche Anforderungen

Gemini wird in drei unterschiedlichen Ausführungen angeboten:

  1. Gemini Ultra – die größte und leistungsfähigste Version, speziell für hochkomplexe Aufgaben.
  2. Gemini Pro – geeignet für ein breites Spektrum an Aufgaben.
  3. Gemini Nano – entwickelt für Android-Nutzer, die Gemini-basierte Apps erstellen möchten. Ein Beispiel hierfür ist die Möglichkeit, mit Gemini Nano Aufnahmen der Recorder-App auf dem Pixel 8 Pro Handy zu summarisieren (derzeit allerdings nur auf Englisch).
Siehe auch  Weltweiter Smartphone-Markt zeigt Anzeichen einer Erholung

Konkurrenz für OpenAI’s GPT-Modelle

Google hat Gemini ins Rennen geschickt, um mit den GPT-Modellen von OpenAI zu konkurrieren. Sissie Hsiao, Vizepräsidentin von Googles AI-Chatbot Bard, verkündete, dass Gemini Pro in sechs der acht Industrie-Benchmarks GPT-3.5 übertroffen hat. Googles fortschrittlichstes Modell, Gemini Ultra, konnte allerdings nur in einem der acht Benchmarks gegen das neuere GPT-4 bestehen.

Nach der Veröffentlichung von ChatGPT durch OpenAI vor etwa einem Jahr haben sich zahlreiche Technologieunternehmen darum bemüht, eigene Chatbots und LLMs zu entwickeln, um mit dem AI-Startup zu konkurrieren. Googles jüngste Bewertungen von Gemini deuten jedoch darauf hin, dass das Unternehmen noch einiges an Arbeit vor sich hat, um OpenAI’s Angeboten ebenbürtig zu sein oder diese zu übertreffen.

Siehe auch  Samsungs OLED-Innovationen auf der CES 2024

Weitere spannende Entwicklungen rund um Gemini

Upgrade für Bard: Bard, Googles AI-Chatbot, wurde nun mit Gemini Pro verbessert, was dem Chatbot eine erweiterte Argumentations- und Verstehensfähigkeit verleiht. Der mit Gemini Pro ausgestattete Bard ist derzeit nur auf Englisch und in über 170 Ländern verfügbar. Im nächsten Jahr plant Google, Bard mit Gemini Ultra zu integrieren. In den kommenden Monaten wird Gemini auch in anderen Google-Apps, darunter die Suche, Google Ads und der Chrome-Browser, eingebunden werden.

Leistung durch TPUs und GPUs: Gemini läuft auf von Google entwickelten Tensor-Processing-Units (TPUs), die speziell für das Training von KI-Modellen konzipiert sind. Amin Vahdat, Vizepräsident von Googles Cloud AI, teilte in einem Briefing mit, dass Gemini zukünftig sowohl auf TPUs als auch auf Grafikprozessoren (GPUs) trainiert wird. Nvidia stellt den H100-GPU her, einen beliebten Chip für den Betrieb generativer KI-Produkte.

Siehe auch  Microsoft bringt mobile Version der Designer-App heraus

Offene Fragen und Herausforderungen

Während Google Möglichkeiten zur Monetarisierung von Gemini untersucht, bleibt unklar, ob und wie Nutzer für diesen Service zahlen müssen. Ein weiteres Thema, das angesprochen wurde, ist das Phänomen des “Halluzinierens” von LLMs. Eli Collins, Vizepräsident für Produkt bei Googles DeepMind, bestätigte auf der Pressekonferenz, dass LLMs immer noch zu Halluzinationen fähig sind.

Gemini repräsentiert somit einen bedeutenden Schritt in Googles KI-Entwicklung, wobei noch einige Herausforderungen zu meistern sind. Die Kombination aus fortschrittlicher Technologie und strategischer Planung deutet darauf hin, dass Google entschlossen ist, im Bereich der generativen KI eine Führungsrolle zu übernehmen.

Autor

  • Luca Koch

    Luca Koch ist als Redakteur für das Magazin Elektronik Informationen tätig und hat sich auf das Thema Künstliche Intelligenz spezialisiert, schreibt jedoch auch über andere Technik-Themen.

    Alle Beiträge ansehen
Avatar-Foto

Luca Koch

Luca Koch ist als Redakteur für das Magazin Elektronik Informationen tätig und hat sich auf das Thema Künstliche Intelligenz spezialisiert, schreibt jedoch auch über andere Technik-Themen.