OpenAI : le créateur de ChatGPT dévoile Images 2.0, son nouveau générateur d’images surpuissant

OpenAI vient de dévoiler son nouveau générateur d’images d’IA. Sobrement baptisé Images 2.0, celui-ci serait bien plus performant que la plupart de ses concurrents, selon l’entreprise.

ChatGPT propose depuis longtemps un générateur d’images intégré. Celui-ci a d’ailleurs rapidement fait des envieux dans le monde de la tech. Google dispose par exemple d’un générateur d’images via son IA Gemini, qui a été amélioré avec le temps. Il y a quelques mois, Microsoft lançait MAI-Image-1, son tout nouveau générateur d’images maison. Amazon s’est également lancé dans la course avec Nova, un générateur d’images surpuissant.

Crédit photo : OpenAI

Face à une concurrence toujours plus féroce, OpenAI remet le couvert et vient de sortir Images 2.0, un générateur d’images amélioré disponible pour l’ensemble des utilisateurs de ChatGPT. Celui-ci serait capable de produire des images d’une qualité supérieure, tout en possédant des capacités d’affichage de texte optimisées.

Images 2.0 : « c’est comme passer de GPT-3 à GPT-5 d’un seul coup »

Il est vrai que les générateurs d’images ont parfois tendance à se tromper lorsqu’il s’agit de générer du texte. C’est d’ailleurs souvent à cela que l’on reconnaît une image générée par l’IA. Mais, après avoir tenté de rectifier le problème l’année dernière, OpenAI irait encore plus loin avec Images 2.0.

Les fautes de frappe seraient ainsi « très rares » avec Images 2.0. Par ailleurs, OpenAI décline son nouveau générateur en deux versions. La première, baptisée « instantané », est disponible pour l’ensemble des utilisateurs gratuits de ChatGPT. La seconde, nommée « réflexion », est réservée aux abonnés payants Plus, Pro et Business.

Cette dernière version serait à même de vérifier des informations en ligne et de se corriger elle-même, selon OpenAI. « Lorsqu’un modèle de réflexion est sélectionné dans ChatGPT, Images 2.0 peut rechercher des informations en temps réel sur le web, créer plusieurs images distinctes à partir d’un seul prompt et vérifier ses propres résultats », explique le créateur de ChatGPT.

« Si l’on considère DALL·E comme des dessins rupestres, et Images 1.0 comme de l’art antique, alors Images 2.0 représente la Renaissance », affirme l’entreprise. Le patron d’OpenAI, Sam Altman, affirme même qu’« Images 2.0 est une avancée majeure ; c’est comme passer de GPT-3 à GPT-5 d’un seul coup ».

  Source : gizmodo