OpenAI continue de faire avancer l’intelligence artificielle avec l’annonce de son nouveau modèle, o3, qui a récemment réussi à franchir la barre du benchmark ARC-AGI, un exploit inégalé depuis cinq ans. Dans cet article, nous allons explorer les détails captivants de cette avancée majeure ainsi que les implications que cela pourrait avoir pour l’avenir de l’IA.
Qu’est-ce que le modèle o3 ?
Le modèle o3 d’OpenAI représente une avancée révolutionnaire en matière de raisonnement et d’intelligence artificielle. Avec un score impressionnant de 87,5 % sur l’ensemble d’évaluation semi-privé d’ARC-AGI, il dépasse le seuil de 85 %, généralement atteint par les humains. Ce score est d’autant plus remarquable quand on considère que le modèle précédent, o1, n’a obtenu que 32 % dans des tests similaires.
Les caractéristiques du modèle o3
OpenAI a conçu le modèle o3 pour tester l’intelligence générale de l’IA, mettant l’accent sur la capacité de résoudre des problèmes nouveaux sans se reposer sur des schémas mémorisés. Cela signifie que le modèle est capable de comprendre et de traiter des situations inédites, ce qui le rapproche de l’intelligence humaine.
En plus de l’ARC-AGI, le modèle o3 a également montré des performances impressionnantes dans d’autres ensembles de tests :
- SWE-bench Verified : 71,7
- Codeforces : 2 727
- AIME 2024 : 96,7
- GPQA Diamond : 87,7
Présentation du modèle o3-mini
En plus du modèle o3, OpenAI a introduit o3-mini. Ce modèle est une version distillée du modèle o3, optimisée pour le codage, offrant des performances rapides à un coût réduit. Il existe trois réglages de calcul pour o3-mini : faible, moyen et élevé. Au réglage moyen, le o3-mini surpasse le modèle o1 tout en étant plus économique et avec une latence réduite.
Il convient de noter qu’OpenAI a sauté le modèle o2 pour éviter toute confusion légale avec O2, un opérateur de réseau mobile basé au Royaume-Uni, choisissant donc d’introduire directement le modèle o3.
Disponibilité et futur d’OpenAI
OpenAI effectue actuellement des tests de sécurité sur les modèles o3 et o3-mini. Il est prévu que le modèle o3-mini soit accessible au public pour des tests de sécurité d’ici la fin janvier 2025. Après des tests rigoureux et l’approbation des régulateurs, le modèle o3 sera également déployé.
Cette avancée dans le domaine de l’intelligence artificielle pourrait marquer une étape significative vers l’AGI (Intelligence Artificielle Générale), un système capable de rivaliser, voire de surpasser, l’intelligence humaine. La route est encore longue, mais avec des innovations comme le modèle o3, OpenAI se positionne comme un leader incontesté dans ce secteur dynamique.
Conclusion
OpenAI prouve une fois de plus son engagement envers l’innovation en dévoilant le modèle o3. Ce succès à l’ARC-AGI ouvre la voie à de nouvelles possibilités pour l’intelligence artificielle, allant potentiellement au-delà de ce que nous avons imaginé. Il sera fascinant de suivre l’évolution de ces technologies dans les années à venir.