fbpx

o3 und o3-mini von OpenAI:
Top-Modell für KI-Reasoning & Programmierung in 2025

21/12/2024
Schulte_Markus_300x300px

Markus Schulte

AI Solution Development, Autor

Inhaltsverzeichnis
Teilen
AI Newsletter

OpenAI sorgt zum Abschluss der „12 Days of OpenAI“-Reihe mit zwei hochmodernen KI-Systemen für Aufsehen: o3 und o3-mini. CEO Sam Altman gab bekannt, dass o3-mini Ende Januar 2025 erscheint, gefolgt vom Prem

OpenAI sorgt zum Abschluss der „12 Days of OpenAI“-Reihe mit zwei hochmodernen KI-Systemen für Aufsehen: o3 und o3-mini. CEO Sam Altman gab bekannt, dass o3-mini Ende Januar 2025 erscheint, gefolgt vom Premium-Modell o3. Diese Neuentwicklungen basieren auf dem kürzlich eingeführten o1, das bereits neue Standards in der KI-Problemverarbeitung (Reasoning) gesetzt hat.

Warum also keine „o2“? Die Bezeichnung wurde aufgrund von Markenrechten des Telekomkonzerns Telefónica O₂ übersprungen.

o3 von OpenAI: Präzision und Effizienz im Vergleich

Bei der Programmierung setzt o3 mit 71,7 Prozent Genauigkeit einen neuen Spitzenwert und übertrifft o1 um 22,8 Prozentpunkte. In der American Mathematics Invitational kommt o3 auf 96,7 Prozent und demonstriert so sein Potenzial bei komplexen mathematischen Aufgaben. Die Grafik unten zeigt, wie sich die Genauigkeit von o3 von seinen Vorgängern abhebt und wo die o3-mini-Varianten einzusortieren sind.

Mathematische Genauigkeit und Latenzzeiten von OpenAI-Modellen bei AIME und o1-Traffic
Mathematische Genauigkeit und Latenzzeiten von OpenAI-Modellen bei AIME und o1-Traffic

Bei den Latenzzeiten überzeugt Gpt-4o mit nur 0,5 ms. Bei den o3-mini-Modellen steigt die Latenz je nach Komplexität etwas an. Die o3-mini (low)-Variante bietet dafür eine ideale Balance aus Schnelligkeit und Rechenaufwand, während die o3-mini (high)-Version mehr Zeit benötigt, aber tiefergehende Analysen unterstützt.

Auch in der Contest-Programmierung (zum Beispiel auf Codeforces) erzielt o3 beachtliche Werte. Mit einer Elo von 2727 übertrifft es alle Vorgängerversionen. Die o3-mini-Varianten bleiben dabei ebenfalls konkurrenzfähig und punkten insbesondere bei ihrem günstigeren Kosten-Nutzen-Verhältnis.

Elo-Bewertung und Kosteneffizienz von OpenAI-Modellen im Bereich Contest-Programmierung
Elo-Bewertung und Kosteneffizienz von OpenAI-Modellen im Bereich Contest-Programmierung

Mit der Einführung von o3-mini hat OpenAI eine Lösung geschaffen, die sowohl Leistung als auch Ressourceneffizienz im Blick behält. Diese Varianten sind ideal für Unternehmen, die fortschrittliche KI nutzen möchten, ohne zu tief in die Tasche greifen zu müssen.

Ist o3 AGI (Artificial General Intelligence)?

CEO Sam Altman bezeichnet die neuen o3-Modelle als Beginn der „nächsten Phase“ der KI. Dies hat Spekulationen genährt, dass o3 in Richtung AGI weitergekommen ist. Tatsächlich schneiden die o3-Modelle im ARC-AGI-Benchmark außergewöhnlich gut ab, indem sie effizientes Generalisieren und das Erlernen neuer Fähigkeiten demonstrieren.

Der Benchmark-Erfinder François Chollet meint jedoch, dass o3 noch kein AGI ist. Ihm zufolge scheitert das System weiterhin an einer Reihe einfacher Aufgaben, die viele Menschen problemlos lösen können. Die ARC Prize Initiative wertet die aktuelle Entwicklung zwar als wichtigen Schritt auf dem Weg zu AGI, vermisst aber verschiedene Kernkomponenten (etwa episodisches Gedächtnis, Meta-Kognition oder komplexe Planungsprozesse), die bisher nicht vollständig integriert sind.

Ein weiterer Kritikpunkt: o3 löst viele Aufgaben, indem es enorme Rechenressourcen einsetzt. Kritiker wie Melanie Mitchell vom Santa Fe Institute monieren, dass „brute force“-Verfahren nicht der eigentlichen Idee des Benchmarks entsprechen, so der NewScientist.

Laut den Organisatoren der ARC Challenge ist das Übertreffen dieser Wettbewerbs-Benchmarks daher noch kein Zeichen für den Durchbruch zur AGI.

Ganz anders sehen das aber teilweise Mitarbeiter bei OpenAI, die davon überzeugt sind, dass o3 die Version-1 von AGI ist.

Sicherheit zuerst: OpenAI lädt Experten zur Risikobewertung ein

Die neuen KI-Modelle durchlaufen intensive interne Tests. Parallel hat OpenAI einen öffentlichen Sicherheitsaufruf gestartet, bei dem sich Entwickler und Sicherheitsexperten über ein Formular bis zum 10. Januar 2025 bewerben können. Ziel ist es, potenzielle Schwachstellen vor der breiten Veröffentlichung zu identifizieren.

Im Rahmen dieses Programms arbeitet OpenAI eng mit internen Sicherheitsteams, externen „Red Teams“ und Institutionen wie dem U.S. AI Safety Institute und dem UK AI Safety Institute zusammen. Der erweiterte Kreis der Tester soll gezielt Risiken aufdecken, die bei fortschrittlichen Modellen aus der O-Serie auftreten könnten. Dazu zählen insbesondere:

  • Entwicklung robuster Sicherheitsbewertungen: Aufdeckung neuartiger Fähigkeiten oder potenzieller Risiken durch systematische Tests.
  • Demonstrationen potenzieller Hochrisiko-Fähigkeiten: Analyse, wie Modelle ohne angemessene Sicherheitsvorkehrungen Schaden verursachen könnten.

12 Days of OpenAI

Im Zuge der „12 Days of OpenAI“-Kampagne vor den Festtagen 2024 hat das Unternehmen zahlreiche Neuerungen präsentiert. So ist nun die Integration von ChatGPT in gängige Messaging-Dienste verfügbar, was die Kommunikation mit KI deutlich erleichtert.

Eine weitere Neuheit: 1-800-ChatGPT. Nutzer in den USA können ChatGPT über einen Anruf oder per WhatsApp-Nachricht an 1-800-CHATGPT (1-800-242-8478) kontaktieren, ohne ein Konto zu benötigen. In anderen Regionen ist der Dienst ebenfalls über WhatsApp verfügbar, allerdings mit einigen Einschränkungen: Kostenlose Gespräche sind auf 15 Minuten pro Monat limitiert und WhatsApp-Nachrichten werden pro Tag begrenzt.

Zudem gibt es jetzt ein Premium-Abonnement namens Pro für 200 USD/Monat. Es ermöglicht uneingeschränkten Zugriff auf o1, o1-mini, GPT-4o und den erweiterten Audiomodus mit zusätzlicher Video- und Bildschirmfreigabe. Auch höhere Nutzungslimits und eine gesteigerte Rechenleistung über den o1 Pro-Modus sind inklusive. Ebenso erhalten Abonnenten Zugriff auf die Videogenerierung mit Sora.

Sam Altman über die nächste Generation von KI-Systemen

Bislang wurde häufig zwischen spezialisierter Intelligenz (beispielsweise Chatbots oder Bildverarbeitung) und echter AGI unterschieden. Doch diese Grenzen verwischen zunehmend: Für einige ist AGI (kurz für Artificial General Intelligence) eine KI, die Aufgaben auf dem Niveau eines Menschen lösen kann. Andere sehen in AGI eine Art „Superintelligenz“ (ASI, Artificial Superintelligence), die den Menschen in allen Belangen übertrifft.

Laut Sam Altman können Modelle wie o3 und seine Nachfolger schon heute Aufgaben bewältigen, die viele noch in jüngster Vergangenheit für „unglaublich“ hielten. Bis 2025 rechnet er damit, dass solche Systeme hochkomplexe kognitive Herausforderungen problemlos lösen werden. Der aktuelle Diskurs zeigt: Der Weg zur echten „Allgemeinen Künstlichen Intelligenz“ ist vielleicht kürzer geworden, aber noch lange nicht zu Ende.

ChatGPT
für Handwerker

Hol dir jetzt kostenlos die besten ChatGPT Prompts für Handwerker. Du wirst damit bei Preisverhandlungen siegen können und Gegenargumente entkräften. Viele Prompts und ein breites Spektrum an Themen um deinen Arbeitsalltag zu erleichtern. Lade dir jetzt diese einmalige Prompt-Bibliothek speziell für Handwerksbetriebe herunter.

Webinar Release KI im Handwerk

Du hast eine Frage?