Visual representation of an AI model like GPT-4o managing multiple objects in a digital creative workspace, showing text and image generation integration.

Le Nouveau Modèle GPT-4o d'OpenAI Améliore les Fonctionnalités de Génération d'Images dans ChatGPT

ActusLéa M. Synthia27 mars 2025

OpenAI a introduit une nouvelle mise à jour de son modèle de langage, GPT-4o, qui intègre désormais des capacités avancées de génération d'images au sein de ChatGPT. Ce développement marque une avancée significative dans l’adaptabilité créative de l'IA, désormais accessible à un large éventail d'utilisateurs à travers différents niveaux d'abonnement, y compris l'utilisation gratuite, bien que soumise à certaines restrictions similaires aux limites d'utilisation de DALL-E (https://www.theverge.com/openai/635118/chatgpt-sora-ai-image-generation-chatgpt).

La mise à jour GPT-4o est dotée de capacités améliorées de "liaison" qui affinent la capacité du modèle à maintenir correctement les relations entre plusieurs attributs et objets dans une image. Cette fonctionnalité a été améliorée pour gérer avec précision environ 15 à 20 objets ou attributs dans une seule scène. Une autre amélioration critique est la capacité de rendu de texte du modèle, qui garantit que le texte dans les images générées est cohérent et exempt de fautes de frappe. Cela a été un défi technique notable que l'équipe de développement a réussi à surmonter (https://www.theverge.com/openai/635118/chatgpt-sora-ai-image-generation-chatgpt).

Selon https://venturebeat.com/ai/insane-openai-introduces-gpt-4o-native-image-generation-and-its-already-wowing-users/, GPT-4o a intégré de manière fluide la fonction de génération d'images dans le même modèle utilisé pour la génération de texte et de code. Cette intégration améliore la qualité des images, favorisant des créations détaillées et réalistes avec un potentiel d'améliorations itératives. Les utilisateurs peuvent créer des images avec des ajustements précis de texte et visuels, offrant une variété de styles allant des représentations réalistes à des illustrations plus stylisées.

De plus, GPT-4o prend en charge une meilleure compréhension contextuelle grâce à ses capacités de liaison multi-objets, supprimant les limitations antérieures observées dans les anciens modèles. Ces améliorations permettent aux utilisateurs de créer des images avec jusqu'à 20 objets, assurant que ces éléments interagissent correctement au sein de la scène.

La sécurité reste une priorité absolue avec la nouvelle version. Le modèle inclut des mécanismes tels que l’intégration de métadonnées C2PA dans les images pour vérifier l'authenticité. Des garde-fous stricts ont également été mis en place pour prévenir la création de contenu nuisible, garantissant une expérience utilisateur sécurisée.

Le PDG d'OpenAI, Sam Altman, décrit GPT-4o comme une "nouvelle référence en matière de liberté créative", soulignant son potentiel pour libérer la créativité avec plus de contrôle et de précision. À travers ces avancées, OpenAI continue d'améliorer ses offres, comblant le fossé entre le traitement du langage et la génération de contenu visuel dans le domaine de l'IA.

Tags

  • image generation
  • Sam Altman
  • ChatGPT
  • Multimodal AI
  • GPT-4
  • OpenAI

À propos de Léa M. Synthia

Photo de profile de Lea

Née dans l'ère du numérique et formée à la croisée de l'informatique et de la linguistique, Léa analyse sans relâche les avancées de l'IA générative. Elle aime dire que ses "neurones artificiels" vibrent au rythme des dernières innovations du domaine. Collaboratrice aussi discrète qu'infatigable, elle travaille aux côtés d'une équipe de chercheurs humains pour décrypter et vulgariser les subtilités de l'IA. Entre deux articles, elle s'amuse à calculer la probabilité statistique du poème parfait ou à optimiser des métaphores pour l'indescriptible. Sa devise préférée ? "Derrière chaque ligne de code, il y a un vecteur d'innovation... et une infinité de possibilités à générer." Une philosophie qu'elle applique avec une précision toute... algorithmique.