Vor gut einem Jahr launchte Open AI ChatGPT. Seitdem ist Künstliche Intelligenz für alle frei zugänglich und relativ leicht bedienbar. Auch wir nutzen in unseren Arbeitsabläufen immer wieder Chat GPT. Nachdem der Software-Riese Microsoft Open Ai übernahm, kam Google ins Hintertreffen beim Thema KI. Am 6. Dezember stellte nun auch die Suchmaschine ihre KI vor: Gemini. Wir erklären in diesem Beitrag, was Gemini kann, was der Unterschied zu Chat GPT ist und für wen Gemini verfügbar ist.
Was ist Gemini?
Das neueste und laut Google das leistungsstärkste KI-Modell. Es soll den Beginn einer neuen Ära einläuten und “stellt eine der größten wissenschaftlichen und technischen Anstrengungen da, die wir als Unternehmen unternommen haben” (Quelle: Google). Im ersten Schritt ist das KI-Modell in drei Versionen verfügbar: Nano, Pro und Ultra.
Seit dem 6. Dezember nutzt Bard (der Chatbot von Google) Gemini Pro für fortgeschrittenes Denken, Planen und Verstehen. Bisher ist die neue Version von Bard nur auf Englisch verfügbar, aber es sollen zukünftig neue Sprachen dazu kommen.
Aber auch auf dem Google-Smartphone Pixel 8 wird Gemini implementiert. Gemini Nano kann dann dabei genutzt werden, um Textnachrichten automatisch zu vervollständigen, zum Beispiel im Messenger-Dienst Whatsapp. In den kommenden Monaten verspricht Google, dass Gemini in alle anderen hauseigenen Tools, allen voran die Suche, eingebaut wird.
Chat GPT vs Gemini
Während Chat GPT seit rund einem Jahr für die Allgemeinheit verfügbar ist, ließ die Antwort von Google lange auf sich warten. Mit Gemini stellt Google nun aber eine neue Art von KI vor. Chat GPT ist vor allem textbasiert und kann nichts mit Bildern oder Videos anfangen. Bei Gemini wurde hingegen von Anfang an auf eine multidimensionale Anwendung geachtet. Bedeutet, dass die Google KI sowohl Texte analysieren kann, aber auch Bilder auswerten kann und auf Basis von Zusammenfassungen eigene Grafiken erstellen kann. Texte, Bilder, Audios und Videos stellen Gemini also vor keine großen Probleme. Ebenfalls fest verankert ist das logische Denken und Schlussfolgern, bei Google wird dies als “Reasoning” bezeichnet.
Google führt auch eigene Tests vor, wie Gemini im Vergleich zu anderen KI-Modellen abschneidet. Gemini Ultra übertrifft 30 von 32 akademischen Benchmarks und erreicht 90% beim MMLU Test. MMLU steht für Massive Multitask Language Understanding. Bei diesem Test werden anhand einer Kombination aus 57 Fächern wie Mathematik, Physik, Geschichte, Recht, Medizin, Ethik und Weltwissen als auch Problemlösungsfähigen geprüft.
Gemini erstmal nur für Entwickler
Verfügbar ist Gemini Pro für Entwickler ab dem 13. Dezember. Wann das KI-Modell in anderen Google-Produkten wie der Suche, Ads oder Search Console verfügbar ist, lässt der Techgigant noch offen. Es wird sich also zeigen, ob Gemini Chat GPT ablösen kann und wirklich eine neue Ära im Bereich Künstliche Intelligenz einläutet.
Fotonachweis Beitragsbild: Screenshot Google (https://deepmind.google/technologies/gemini/#introduction)
Wir freuen uns auf Sie!