Sam Altman a révélé aujourd’hui qu’Openai publiera un modèle d’intelligence artificielle de poids ouvert dans les prochains mois.
« Nous sommes ravis de publier un nouveau modèle de langue ouverte puissant avec le raisonnement dans les prochains mois », a écrit le PDG sur x.
Cette décision est en partie une réponse au succès en fuite du modèle R1 de la société chinoise Deepseek, ainsi que la popularité des modèles Llama de Meta.
Peu de temps après la sortie du modèle de Deepseek en janvier, Altman a déclaré qu’Openai était «du mauvais côté de l’histoire» concernant les modèles ouverts, signalant un changement possible de course. Lundi, il a déclaré que l’entreprise envisageait de publier un modèle de poids ouvert depuis un sure temps, ajoutant «maintenant il est essential de le faire».
Openai peut ressentir le besoin de montrer qu’il peut former le nouveau modèle à moindre coût, automobile le modèle de Deepseek a été prétendument formé à une fraction du coût de la plupart des grands modèles d’IA.
« C’est une nouvelle incroyable », a déclaré à Wired Wired, Clement Delangue, cofondateur et PDG de HuggingFace, une entreprise spécialisée dans l’hébergement de modèles d’IA ouverts. « Avec Deepseek, tout le monde réalise le pouvoir des poids ouverts. »
OpenAI met actuellement son IA disponible by way of un chatbot et by way of le cloud. R1, LLAMA et d’autres modèles ouverts peuvent être téléchargés gratuitement et modifiés. Les poids d’un modèle se réfèrent aux valeurs à l’intérieur d’un grand réseau neuronal – quelque selected qui est défini pendant l’entraînement. Les modèles de poids ouvert sont moins chers à utiliser et peuvent également être adaptés à des cas d’utilisation sensibles, comme la gestion des informations hautement confidentielles.
Steven Heidel, membre du personnel method d’Openai, Republié Altman Annonce et ajouté: « Nous publions un modèle cette année que vous pouvez exécuter sur votre propre matériel. »
Johannes Heidecke, un chercheur travaillant sur la sécurité de l’IA à OpenAI, a également republié le message sur X, ajoutant que la société effectuerait des assessments rigoureux pour s’assurer que le modèle de poids ouvert ne pouvait pas facilement être utilisé à mauvais escient. Certains chercheurs de l’IA craignent que les modèles ouverts puissent aider les criminels à lancer des cyberattaques ou même à développer des armes biologiques ou chimiques. «Bien que les modèles ouverts apportent des défis uniques, nous sommes guidés par notre cadre de préparation et ne publierons pas de modèles, nous pensons que nous posons des risques catastrophiques», a écrit Heidecke.
Openai In the present day a également publié une web page Internet invitant les développeurs pour demander un accès précoce au prochain modèle. Altman a déclaré dans son article que la société accueillerait des événements pour les développeurs avec des prototypes précoces du nouveau modèle dans les semaines à venir.
Meta a été la première grande entreprise d’IA à poursuivre une approche plus ouverte, publiant la première model de Llama en juillet 2023. Un nombre croissant de modèles d’IA à poids ouvert sont maintenant disponibles. Certains chercheurs notent que le lama et certains autres modèles ne sont pas aussi transparents qu’ils pourraient l’être, automobile les données de formation et d’autres détails sont toujours secrètes. Meta impose également une licence qui limite la capacité des autres sociétés à profiter des functions et des outils construits à l’aide de lama.
Mise à jour du 31 mars 2025, 4:21 EST: Cet article a été mis à jour avec un commentaire de Clement Delangue, cofondateur et PDG de Huggingface.