Openai vient d’annoncer que tous les utilisateurs pourront bientôt générer des pictures directement à l’intérieur de Chatgpt. Il se déroule sur Chatgpt Plus, Professional, Group et, surtout, les utilisateurs gratuits. Ce sera l’outil de génération d’pictures par défaut dans 4O, il n’y aura donc pas besoin d’ouvrir Dall-E chaque fois que vous voulez préparer une picture d’un chat dans l’espace mangeant des lasagnes ou autre selected. La fonctionnalité arrive également à Sora.
La société dit que la plate-forme "Générez des pictures de haute qualité en fonction de votre invite, de votre dialog et de vos fichiers téléchargés." Pour ce dernier level, il sera en mesure de transformer des pictures préexistantes en fonction des invitations. OpenAI se vante également des améliorations significatives du rendu de texte et de la compréhension contextuelle.
Ces nouveaux outils sont destinés à une utilisation personnelle et professionnelle. En tant que tel, OpenAI donne un sure nombre d’exemples sur l’endroit où ce sort de génération d’pictures pourrait être utile. Il s’agit notamment de la création d’infographies, de graphiques promotionnels des médias sociaux et d’pictures avec beaucoup de texte, comme on le voit ci-dessous.
Ceci étant un outil de génération moderne, il peut également gérer des visuels haut de gamme. La société affirme qu’elle suggest un "Capacité forte pour le photoréalisme, y compris la lumière, l’ombre et la précision de la texture." La capacité de comprendre le contexte pourrait également être utile, automobile Openai dit que cela pourrait être utilisé pour créer une «affiche d’oiseaux trouvés dans Central Park» ou un "Visualisation d’une époque d’histoire de l’artwork discutée précédemment dans la dialog."
Dites bonjour à GPT-4O, notre nouveau modèle phare qui peut raisonner à travers l’audio, la imaginative and prescient et le texte en temps réel: https://t.co/myhzb79uqn
Entrée de texte et d’picture qui déploie aujourd’hui dans l’API et le chatppt avec la voix et la vidéo dans les semaines à venir. pic.twitter.com/uuthkzyzyx
– Openai (@openai) 13 mai 2024
Il est construit sur GPT-4O, un modèle d’IA qui était. Le "o" représente "omni"qui est une référence aux capacités multimodales du modèle. C’est ce qui permet de nombreuses fonctionnalités susmentionnées, comme être succesful d’itérer sur des fichiers téléchargés. Les nouvelles d’aujourd’hui ressemblent à une autre étape sur la longue route vers la fonctionnalité «une IA pour les gouverner» .
Cet article est apparu à l’origine sur Engadget à
lien source