Gemini Gemini: Das große Modell, das die KI-Ära anführt und ChatGPT vollständig übertrifft, wurde veröffentlicht!

Google Gemini Artificial Intelligence Big Model wird eingeführt, um chatgpt, das bisher größte und leistungsfähigste KI-Modell, vollständig zu übertreffen, und das bisher flexibelste Modell

Zwillinge Profil:

Gemini ist unser größtes und leistungsfähigstes KI-Modell. Es ist unser bisher flexibelstes Modell, das von Rechenzentren bis hin zu mobilen Geräten effizient eingesetzt werden kann. Seine hochmodernen Funktionen werden die Art und Weise, wie Entwickler und Unternehmenskunden KI entwickeln und skalieren, erheblich verbessern.

Optimierte Gemini 1.0 (unsere erste Version) für drei verschiedene Größen:

Gemini Ultra - unser größtes und leistungsfähigstes Modell für hochkomplexe Aufgaben.
Gemini Pro - unser bestes Modell für skalierbare Aufgaben.
Gemini Nano - unser effizientestes geräteseitiges Aufgabenmodell.

Leistung auf dem neuesten Stand der Technik

Wir haben das Gemini-Modell eingehend getestet und seine Leistung bei einer Vielzahl von Aufgaben bewertet. Von natürlichem Bild-, Audio- und Videoverständnis bis hin zu mathematischen Schlussfolgerungen übertrifft Gemini Ultra den aktuellen Stand der Technik bei 30 der 32 weit verbreiteten akademischen Benchmarks, die in der Forschung und Entwicklung von Large Language Modelling (LLM) verwendet werden.

Mit einer Punktzahl von 90,0% ist Gemini Ultra das erste Modell, das menschliche Experten im MMLU-Test (Massive Multi-Tasking Language Understanding) übertrifft. Der Test kombiniert 57 Fächer wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik, um Wissen und Problemlösungsfähigkeiten zu testen.

Unsere neue MMLU-Benchmarking-Methode ermöglicht es Gemini, seine Argumentationsfähigkeiten zu nutzen, um vor der Beantwortung schwieriger Fragen sorgfältiger nachzudenken, was zu einer erheblichen Verbesserung gegenüber der ausschließlichen Verwendung erster Eindrücke führt.

Dieses Diagramm zeigt die Leistung des Gemini Ultra im Vergleich zum GPT-4 in gängigen Text-Benchmarks (API-Zahlen werden berechnet, wenn keine Berichtszahlen vorliegen).

Gemini Gemini: Das große Modell, das die KI-Ära anführt und ChatGPT vollständig übertrifft, wurde veröffentlicht!
Gemini übertrifft den Stand der Technik in einer Reihe von Benchmarks, einschließlich Text und Kodierung.

Der Gemini Ultra erreichte auch einen Spitzenwert von 59,4% im neuen MMMU-Benchmark, der aus multimodalen Aufgaben besteht, die eine Vielzahl von Bereichen abdecken und durchdachtes Denken erfordern.

Laut den von uns getesteten Bild-Benchmarks übertrifft Gemini Ultra frühere State-of-the-Art-Modelle ohne die Hilfe eines OCR-Systems (Object Character Recognition), das Text aus Bildern zur weiteren Verarbeitung extrahiert. Diese Benchmarks unterstreichen Geminis angeborene Multimodalität und zeigen erste Anzeichen für Geminis Fähigkeit, komplexere Schlussfolgerungen zu ziehen.

Weitere Einzelheiten finden Sie in unserem Technischen Bericht Gemini.

Dieses Diagramm zeigt die Leistung des Gemini Ultra im Vergleich zum GPT-4V bei einem Multimode-Benchmark, bei dem das frühere SOTA-Modell Funktionen auflistete, die vom GPT-4V nicht unterstützt wurden.

Gemini Gemini: Das große Modell, das die KI-Ära anführt und ChatGPT vollständig übertrifft, wurde veröffentlicht!
Gemini übertrifft den Stand der Technik in einer Reihe von Multimode-Benchmarks.

Wie in der Grafik zu sehen ist, übertrifft Gemini in einer Reihe von Multimode-Benchmarks den Stand der Technik.

Merkmale der nächsten Generation

Bisher bestand der Standardansatz zur Erstellung multimodaler Modelle darin, getrennte Komponenten für verschiedene Modalitäten zu trainieren und sie dann zusammenzufügen, um einige dieser Funktionen grob zu imitieren. Diese Modelle sind manchmal gut bei der Durchführung bestimmter Aufgaben, wie z. B. der Beschreibung von Bildern, haben aber Schwierigkeiten bei konzeptionellen und komplexen Schlussfolgerungen.

Wir haben Gemini so konzipiert, dass es von Haus aus multimodal ist, und es von Anfang an für verschiedene Modalitäten vortrainiert. Anschließend haben wir es mit zusätzlichen multimodalen Daten feinabgestimmt, um seine Effektivität weiter zu verfeinern. Auf diese Weise kann Gemini eine breite Palette von Eingaben von Grund auf nahtlos verstehen und schlussfolgern, was bestehende multimodale Modelle weit übertrifft - und seine Fähigkeiten sind in fast jedem Bereich auf dem neuesten Stand.

Erfahren Sie mehr über die Funktionen von Gemini und sehen Sie, wie es funktioniert.

komplexe Argumentation

Die hochentwickelten multimodalen Argumentationsfähigkeiten von Gemini 1.0 helfen dabei, komplexe schriftliche und visuelle Informationen zu verstehen. Dadurch ist es in einzigartiger Weise in der Lage, Wissen zu entdecken, das in großen Datenmengen nur schwer zu erkennen ist.

Seine bemerkenswerte Fähigkeit, aus Hunderttausenden von Dokumenten durch Lesen, Filtern und Verstehen von Informationen Erkenntnisse zu gewinnen, wird in vielen Bereichen, von der Wissenschaft bis zum Finanzwesen, neue Durchbrüche mit digitaler Geschwindigkeit ermöglichen.

Zwillinge eröffnen neue wissenschaftliche Erkenntnisse.

Verstehen von Text, Bild, Ton usw.
Gemini 1.0 ist darauf trainiert, Text, Bilder, Audio und mehr gleichzeitig zu erkennen und zu verstehen, so dass es subtile Informationen besser verstehen und Fragen zu komplexen Themen beantworten kann. Dadurch ist er besonders gut in der Lage, die Argumentation in komplexen Fächern wie Mathematik und Physik zu erklären.

Zwillinge erklärt mathematische und physikalische Überlegungen.

Fortgeschrittene Kodierung

Unsere erste Version von Gemini versteht, interpretiert und erzeugt hochwertigen Code in den weltweit beliebtesten Programmiersprachen wie Python, Java, C++ und Go. Seine Fähigkeit, sprachenübergreifend zu arbeiten und komplexe Informationen zu verstehen, macht es zu einem der weltweit führenden Modelle für Codierungsgrundlagen.

Gemini Ultra schneidet in mehreren Codierungs-Benchmarks gut ab, darunter HumanEval, ein wichtiger Industriestandard für die Bewertung der Leistung bei Codierungsaufgaben, und Natural2Code, unser interner Datensatz, der auf von Autoren generierten Quellen und nicht auf webbasierten Informationen beruht.

Gemini kann auch als Motor für fortgeschrittenere Codesysteme verwendet werden. Vor zwei Jahren haben wir AlphaCode auf den Markt gebracht, das erste KI-Code-Generierungssystem, das in Programmierwettbewerben konkurrenzfähige Leistungen erreicht.

Unter Verwendung einer speziellen Version von Gemini haben wir ein fortschrittlicheres Codegenerierungssystem, AlphaCode 2, entwickelt, das sich durch die Lösung wettbewerbsfähiger Programmierprobleme auszeichnet, die über das Programmieren hinausgehen und komplexe Mathematik und theoretische Informatik beinhalten.

Zwillinge sind besonders gut im Programmieren und im Wettbewerb.

Wenn AlphaCode 2 auf der gleichen Plattform wie der ursprüngliche AlphaCode evaluiert wird, zeigt es dramatische Verbesserungen und löst fast doppelt so viele Probleme, und wir schätzen, dass es 85% der Wettbewerbsteilnehmer übertrifft, was nahe an 50% für AlphaCode liegt.Wenn Programmierer mit den Codebeispielen arbeiten, indem sie bestimmte Eigenschaften für die AlphaCode 2 schneidet besser ab, wenn die Programmierer mit ihm zusammenarbeiten, indem sie bestimmte Eigenschaften für die Codebeispiele definieren.

Wir freuen uns, dass Programmierer zunehmend leistungsstarke KI-Modelle als kollaborative Tools einsetzen, um Probleme zu erörtern, Code-Entwürfe zu erstellen und bei der Implementierung zu helfen, damit sie Anwendungen schneller veröffentlichen und bessere Dienste entwickeln können.

Weitere Einzelheiten finden Sie in unserem AlphaCode 2 Technical Report.

Zuverlässiger, skalierbarer und effizienter
Wir verwenden die von Google intern entwickelten Tensor Processing Units (TPUs) v4 und v5e in unseren AI Optimierung der Infrastruktur für das Training von Gemini 1.0 im großen Maßstab. Wir haben es als das zuverlässigste und skalierbarste Trainingsmodell und als das effizienteste Servicemodell konzipiert.

Auf TPUs läuft Gemini deutlich schneller als frühere, kleinere und weniger leistungsfähige Modelle. Diese speziell entwickelten KI-Beschleuniger waren Googles KI-Produkt

Sie sind das Herzstück der Produkte, die Milliarden von Nutzern von Search, YouTube, Gmail, Google Maps, Google Play und Android bedienen. Außerdem ermöglichen sie es Unternehmen auf der ganzen Welt, kostengünstig umfangreiche KI-Modelle zu trainieren.

Heute haben wir Cloud TPU v5p angekündigt, unser bisher leistungsstärkstes, effizientestes und skalierbarstes TPU-System, das für das Training modernster KI-Modelle entwickelt wurde. Diese TPU der nächsten Generation wird die Entwicklung von Gemini beschleunigen und Entwicklern und Unternehmenskunden helfen, große generative KI-Modelle schneller zu trainieren und neue Produkte und Funktionen schneller in die Hände der Kunden zu geben.

Konstruiert mit Verantwortung und Sicherheit im Mittelpunkt

Wir bei Google setzen uns bei allem, was wir tun, für die Förderung mutiger und verantwortungsvoller künstlicher Intelligenz ein. Auf der Grundlage der KI-Prinzipien von Google und der strengen Sicherheitsrichtlinien in unseren Produkten fügen wir neue Schutzmaßnahmen hinzu, um die multimodalen Fähigkeiten von Gemini zu berücksichtigen. In jeder Phase der Entwicklung berücksichtigen wir potenzielle Risiken und arbeiten daran, sie zu testen und zu mindern.

Gemini verfügt über die bisher umfassendste Sicherheitsbewertung aller KI-Modelle von Google, einschließlich Verzerrungen und Toxizität. Wir haben neue Forschungen zu potenziellen Risikobereichen wie Cyberangriffen, Überredung und Autonomie durchgeführt und die besten Testverfahren von Google Research angewandt, um vor dem Einsatz von Gemini wichtige Sicherheitsprobleme zu identifizieren.

Um blinde Flecken in unserer internen Bewertungsmethodik zu identifizieren, arbeiten wir mit einer Reihe von externen Experten und Partnern zusammen, um unsere Modelle anhand einer Reihe von Fragen zu testen.

Um Sicherheitsprobleme bei Inhalten während der Trainingsphase von Gemini zu diagnostizieren und sicherzustellen, dass die Ergebnisse mit unseren Richtlinien übereinstimmen, verwenden wir Benchmarks wie die "Real Toxicity Hints", einen Satz von 100.000 Hinweisen unterschiedlicher Toxizität, die aus dem Netzwerk extrahiert und von Experten des Allen Institute entwickelt wurden. Für KI. Weitere Einzelheiten zu dieser Arbeit werden in Kürze veröffentlicht.

Um den Schaden zu begrenzen, haben wir spezielle Sicherheitsklassifikatoren entwickelt, um Inhalte, die Gewalt oder negative Stereotypen beinhalten, zu identifizieren, zu kennzeichnen und zusammenzufassen. In Kombination mit leistungsstarken Filtern soll dieser mehrschichtige Ansatz Gemini sicherer und inklusiver für alle machen. Darüber hinaus arbeiten wir weiter an der Lösung bekannter Probleme mit dem Modell, wie z. B. Faktizität, Erdung, Zuschreibung und Bestätigung.

Verantwortung und Sicherheit standen schon immer im Mittelpunkt unserer Modellentwicklung und -einführung. Daher arbeiten wir mit der Industrie und dem weiteren Ökosystem über MLCommons, das Frontier Model Forum und seinen KI-Sicherheitsfonds sowie unser Safe Artificial Intelligence Framework (SAIF) zusammen, das dazu beitragen soll, die Sicherheitsrisiken von KI-Systemen im öffentlichen und privaten Sektor zu mindern. Wir werden bei der Entwicklung von Gemini weiterhin mit Forschern, Regierungen und zivilgesellschaftlichen Gruppen auf der ganzen Welt zusammenarbeiten.

Die Zwillinge in die Welt tragen

Gemini 1.0 ist jetzt für eine Reihe von Produkten und Plattformen verfügbar:

Gemini Pro in Google-Produkte
Wir bringen Gemini durch Google-Produkte zu Milliarden von Menschen.

Ab heute wird Bard eine fein abgestimmte Version von Gemini Pro für fortgeschrittenes Denken, Planen, Verstehen und mehr verwenden. Dies ist das größte Upgrade von Bard seit seiner Einführung. Es wird in über 170 Ländern auf Englisch verfügbar sein, und wir planen, in naher Zukunft verschiedene Modi und neue Sprachen und Standorte zu unterstützen.

Wir bringen Gemini auch auf das Pixel. Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft, das neue Funktionen wie Zusammenfassen in der Recorder-App und Smart Reply in Gboard unterstützt, beginnend mit WhatsApp, wobei im nächsten Jahr weitere Messaging-Apps folgen werden.

In den nächsten Monaten wird Gemini in weiteren unserer Produkte und Dienste erscheinen, z. B. in der Suche, in der Werbung, in Chrome und in Duet AI.

Wir haben begonnen, mit Gemini in der Suche zu experimentieren, und das Ergebnis ist eine schnellere Search Generation Experience (SGE) für die Nutzer und eine um 40% reduzierte Latenzzeit in US-Englisch, zusammen mit einer verbesserten Qualität.

Bauen mit Zwillingen

Ab dem 13. Dezember können Entwickler und Unternehmenskunden über die Gemini-API in Google AI Studio oder Google Cloud Vertex AI auf Gemini Pro zugreifen.

Google AI Studio ist ein kostenloses webbasiertes Entwicklertool, mit dem Sie schnell Prototypen erstellen und Anwendungen mit API-Schlüsseln starten können. Wenn eine vollständig verwaltete KI-Plattform benötigt wird, ermöglicht Vertex AI die Anpassung von Gemini, bietet volle Datenkontrolle und profitiert von zusätzlichen Google-Cloud-Funktionen für Unternehmenssicherheit, Sicherheit, Datenschutz sowie Data Governance und Compliance.

Android-Entwickler können auch mit Gemini Nano bauen, unserem effizientesten geräteseitigen Aufgabenmodell, über AICore, eine neue Systemfunktion, die in Android 14, beginnend mit Pixel 8 Pro-Geräten, verfügbar ist. Melden Sie sich für eine frühe Vorschau von AICore an.

Zwillinge demnächst

Für Gemini Ultra führen wir derzeit umfangreiche Vertrauens- und Sicherheitsprüfungen durch, einschließlich Red Teaming durch vertrauenswürdige externe Parteien, und verfeinern das Modell durch Feinabstimmung und Verstärkungslernen auf der Grundlage menschlichen Feedbacks (RLHF), bevor wir es auf breiter Basis einsetzen.

Als Teil dieses Prozesses werden wir Gemini Ultra ausgewählten Kunden, Entwicklern, Partnern und Sicherheits- und Haftungsexperten für erste Experimente und Feedback zur Verfügung stellen, bevor wir es Anfang nächsten Jahres für Entwickler und Unternehmenskunden einführen.

Anfang nächsten Jahres werden wir auch Bard Advanced einführen, ein neues, innovatives KI-Erlebnis, das Ihnen Zugang zu unseren besten Modellen und Funktionen bietet, beginnend mit Gemini Ultra.

Das Zeitalter der Zwillinge: die Zukunft der Innovation erschliessen

Dies ist ein wichtiger Meilenstein in der Entwicklung von KI und der Beginn einer neuen Ära für uns bei Google, da wir weiterhin schnell innovieren und die Fähigkeiten unserer Modelle verantwortungsvoll verbessern.

Wir haben bisher große Fortschritte bei Gemini gemacht und arbeiten daran, die Funktionalität für künftige Versionen weiter auszubauen, u. a. durch Fortschritte bei der Planung und beim Speicher sowie durch die Hinzufügung kontextbezogener Fenster, um mehr Informationen zu verarbeiten und bessere Reaktionen zu ermöglichen.

Wir sind begeistert von den erstaunlichen Möglichkeiten einer Welt, die durch KI gestärkt wird - eine innovative Zukunft, die die Kreativität fördern, das Wissen erweitern, die Wissenschaft voranbringen und die Art und Weise verändern wird, wie Milliarden von Menschen auf der ganzen Welt leben und arbeiten.

Lesen Sie die Referenz:

https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf

https://storage.googleapis.com/deepmind-media/gemini/gemini_1_bericht.pdf

https://cloud.google.com/vertex-ai

https://deepmind.google/technologies/gemini/

Originalartikel von Chief Security Officer, bei Vervielfältigung bitte angeben: https://cncso.com/de/google-gemini-ai-mega-model-ubertrifft-chatgpt-an-allen-fronten-html

Wie (0)
Vorherige 5. Dezember 2023 um 9:52 Uhr
Weiter 7. Dezember 2023 um 8:27 Uhr

Empfohlen