OpenAI kündigte zwei neue ChatGPT-Modelle an: o3 und o4-mini, die laut OpenAI nicht nur die intelligentesten und leistungsfähigsten Modelle auf dem Markt sind, sondern auch beispiellose Fähigkeiten bieten: die Fähigkeit, Bilder wirklich zu “denken”, nicht nur Bilder anzusehen, sondern auch Bilder in den Inferenzprozess einzubeziehen.
Beide Modelle sind für Nutzer des ChatGPT Plus-, Pro- und Team-Plans verfügbar und werden innerhalb einer Woche für ChatGPT Enterprise- und Edu-Nutzer verfügbar sein. Gleichzeitig können Entwickler die beiden neuen Modelle jetzt über die Chat-Abschluss-API und die Antwort-API verwenden.
O3: Allround-Spieler, Argumentation und visuelles Verständnis sind vollständig verbessert
Laut OpenAI zeichnet sich das o3-Modell in mehreren Bereichen aus, insbesondere bei der Festlegung neuer Standards bei Aufgaben wie Programmierung, mathematischen Operationen, wissenschaftlichem Denken und visuellem Verständnis. Dieses Modell unterstützt auch die Integration mehrerer integrierter Tools, darunter:
Websuche
Python-Arithmetik-Tools
Bildanalyse und -generierung
Datei-Parsing-Funktion
Das bedeutet, dass Benutzer jetzt nicht nur Fragen stellen können, sondern der KI auch erlauben, tatsächlich bei der Analyse von Daten zu helfen, Bilder anzusehen und zu interpretieren und sogar automatisch Bilder oder Code zu generieren.
O4-MINI: Hocheffiziente Inferenzmaschine, geeignet für eine Vielzahl von Abfrageanforderungen
Im Vergleich zu O3 setzt O4-mini auf Kosten- und Geschwindigkeitsoptimierung. Obwohl das Modell klein ist, sind seine Inferenzfähigkeiten immer noch hervorragend, besonders geeignet für Anwendungen, die eine hohe Frequenz und einen hohen Durchsatz erfordern.
OpenAI sagt, dass, wenn Sie Hunderte von Fragen pro Tag stellen müssen, o4-mini definitiv die beste Wahl für Sie ist. Und aufgrund der hervorragenden Leistung und der niedrigen Rechenkosten können Benutzer höhere Nutzungskontingente genießen.
Neue Fähigkeit, über Bilder nachzudenken: vom Betrachten von Bildern zum “Denken mit Bildern”
Eines der größten Highlights beider Modelle ist die erstmalige Fähigkeit, “mit Bildern zu denken”.
Während herkömmliche KI-Modelle nur Bilder sehen können, können o3 und o4-mini nun Bilder in den gesamten Inferenzprozess einbeziehen. Das heißt, wenn Sie ein Bild an das Modell übergeben, sagt es Ihnen nicht nur, was auf dem Bild zu sehen ist, sondern behandelt dieses Bild als logischen Hinweis, analysiert und integriert die Textdaten und antwortet ausführlicher.
Dieser Durchbruch ist ein Segen für Bereiche wie Bildung, Gesundheitswesen, Design und Ingenieurwesen.
Bitten Sie GPT, darüber nachzudenken, was in einer invertierten Notiz in ein Bild geschrieben werden soll Sie können ChatGPT bitten, das Hafenschiff auf dem Foto zu identifizieren und relevante Informationen abzuleiten Die neue Version des Modells ist online, und ChatGPT-Nutzer können es sofort erleben
Von nun an sehen Nutzer von ChatGPT Plus, Pro und Team:
O3
O4-Mini
O4-Mini-Hoch
Sie ersetzen die alten O1, O3-Mini und O3-Mini-High. Obwohl Pro-Benutzer derzeit das o1-pro-Modell wählen können, sagte OpenAI, dass das o3-pro in den nächsten Wochen auf den Markt kommen wird, wenn die volle Tool-Unterstützung verfügbar sein wird.
Entwicklertools werden synchron aktualisiert, und die Antwort-API verbessert die Inferenzfunktionen
Zusätzlich zu ChatGPT-Nutzern können Entwickler jetzt auch o3 und o4-mini über die Chat-Abschluss-API und die neu aktualisierte Antwort-API verwenden.
Die Responses-API fügt mehrere neue Funktionen hinzu, darunter:
Zusammenfassungen der Argumentation
Unterstützung für persistente Token für Inferenzprozesse (verbesserte Leistung)
Integrierte Tools wie Websuche, Dateisuche und Code-Interpreter werden in Kürze unterstützt
Dies ermöglicht es Entwicklern, intelligentere, logischere Anwendungen zu erstellen.
Mit der Einführung von o3 und o4-mini hat OpenAI die Obergrenze der KI-Modelle noch einmal angehoben. Nicht nur die Fähigkeit des logischen Denkens wurde umfassend verbessert, sondern auch die Fähigkeit, “Bilder betrachten und denken” wirklich zu verstehen. Egal, ob Sie ein Entwickler, ein Geschäftsanwender oder ein neugieriger Alltagsbenutzer sind, beide Modelle bieten mehr Optionen und Möglichkeiten.
Dieser Artikel OpenAI bringt o3 und o4-mini auf den Markt: Das intelligenteste ChatGPT-Modell debütiert, und “Bildinferenz” wird zu einem neuen Durchbruch erschien zuerst in Chain News ABMedia.