Gedanken über OpenAIs Sprachmodelle o1 und o3 für 5 Sekunden

  • Im September 2024 stellte das Unternehmen eine Vorschau des Sprachmodells o1 vor.
  • OpenAI kündigte die Modelle o3 und o3-mini an.
    • Das vorherige Modell heißt o1.
    • Das Unternehmen übersprang absichtlich eine Ziffer „aus Respekt vor Telefonica (einem Telekommunikationsunternehmen, das unter der Marke O2 operiert) und der Tradition, schlechte Namen zu erfinden“, sagte OpenAI-CEO Sam Altman.
  • Entwickler trainierten o3 darauf, „nachzudenken“, bevor es eine Benutzeranfrage beantwortet.
    • Das Modell antwortet mit einer leichten Verzögerung.
    • Es wiederholt seine Gedankenkette, bevor es die Antwort gibt, die es für am genauesten hält, so TechCrunch.
  • Benutzer können die Zeit für das Nachdenken „anpassen“ — je mehr Zeit dem Modell gegeben wird, desto besser kann es eine Anfrage bearbeiten.
  • Im ARC-AGI-Test, der entwickelt wurde, um die Fähigkeit einer KI zu messen, Fähigkeiten über ihre Trainingsdaten hinaus zu erlernen, erzielte o3 87,5%.
    • Ein Wert von 85% wird als „menschliches Niveau“ angesehen.
    • TechCrunch weist darauf hin, dass diese Ergebnisse mit Vorsicht zu genießen sind, bis externe Tests durchgeführt werden.
Ein Vergleich der Vorschauversion von o1, o1 und o3 Leistung:Linkes Diagramm: ein MathematikwettbewerbRechtes Diagramm: ein Fragebogen mit wissenschaftlichen Fragen auf HochschulniveauVertikale Skala: Antwortgenauigkeit (Quelle: OpenAI)
  • Derzeit sind beide Modelle der breiten Öffentlichkeit nicht zugänglich, werden jedoch für öffentliche Sicherheitstests geöffnet — Sicherheitsforscher können sie testen.
    • Laut Altman plant OpenAI, o3-mini bis Ende Januar 2025 zu veröffentlichen, gefolgt von o3.
  • OpenAI stellte im September 2024 die Vorschau des Sprachmodells o1 vor (fokussiert auf aufgabenintensive Aufgaben).
    • Anfang Dezember veröffentlichte das Unternehmen die vollständige Version von o1 und fügte ein ChatGPT Pro-Abonnement mit Zugang zu einer „exklusiven“ Version hinzu.