
Google s'engage à simuler le monde physique avec l'IA
Google progresse dans le monde de l'intelligence artificielle avec une nouvelle équipe dédiée à la simulation du monde physique à travers des modèles d'IA. Cette initiative fait partie de Google DeepMind, la branche de recherche en IA de Google, et sera dirigée par Tim Brooks, qui a précédemment co-dirigé le modèle Sora d'OpenAI. L'objectif est de créer des "modèles génératifs massifs" capables d'imiter les complexités de notre environnement physique.
L'initiative vise à exploiter les modèles d'IA existants sous l'égide de Google, comme Gemini, Veo et Genie. Une offre d'emploi pour cette nouvelle équipe souligne l'importance de l'évolution de l'apprentissage de l'IA en utilisant des données vidéo et multimodales, en insistant sur le rôle de tels développements pour progresser vers l'intelligence générale artificielle (AGI). Le but n'est pas uniquement de créer des modèles statiques, mais d'explorer des outils pour la "génération interactive en temps réel" et d'intégrer ceux-ci avec les modèles multimodaux actuels.
D'autres entreprises explorent également ces eaux. World Labs, Decart et Odyssey travaillent sur des modèles du monde appliqués aux médias et aux simulations réalistes, selon TechCrunch. Cependant, comme pour de nombreuses avancées technologiques, des préoccupations existent quant à l'impact potentiel sur la main-d'œuvre. Une étude citée par la même source avertit que l'IA pourrait perturber environ 100 000 emplois aux États-Unis dans les secteurs du cinéma et de l'animation d'ici 2026.
Adobe lance l'édition d'images en masse avec l'IA
Parallèlement aux efforts de Google, Adobe fait des avancées significatives dans l'IA avec l'introduction de "Firefly Bulk Create", un outil innovant capable de modifier jusqu'à 10 000 images à la fois. Il cible les utilisateurs sans expertise en codage en combinant plusieurs APIs alimentées par Firefly, offrant des fonctionnalités telles que "Remove Background" (Supprimer l'arrière-plan) et "Resize" (Redimensionner), particulièrement bénéfiques pour les marketeurs de produits.
L'outil simplifie le processus de changement ou de suppression des arrière-plans et leur remplacement par des images ou des couleurs spécifiques. Il propose des options prédéfinies pour redimensionner les images adaptées aux plateformes de médias sociaux telles que TikTok, Instagram et Facebook. The Verge partage qu'Adobe envisage de mettre en place un modèle de tarification basé sur la consommation pour ces services, similaire à un plan premium sous Adobe Firefly.
De plus, Adobe lance de nouvelles APIs pour les développeurs pour des tâches telles que "Dubbing and Lip Sync" (Doublage et Synchronisation labiale) qui peuvent supporter jusqu'à 14 langues. Il existe aussi des outils pour créer des avatars numériques axés sur des présentations basées sur le texte et la voix, comme détaillé dans un article de The Verge.
Les initiatives de Google et Adobe reflètent les avancées rapides et la diversification des applications des technologies de l'IA, chacune repoussant les limites dans leurs domaines d'intérêt respectifs. Alors que les avantages potentiels sont significatifs, à la fois l'engouement et les inquiétudes concernant l'impact sur l'emploi restent un sujet de discussion actif.