
Nouveaux outils de voix et de médias en intelligence artificielle générative dévoilés par les géants technologiques
Amazon et Google Cloud redéfinissent l'espace de l'IA générative avec leurs dernières innovations, améliorant la polyvalence et les capacités des applications d'IA. Les deux entreprises ont récemment annoncé des mises à jour significatives et des lancements de produits visant à élargir les utilisations potentielles de l'IA générative.
Amazon a introduit Nova Sonic, un nouveau modèle qui combine la compréhension et la génération de la parole en un système unifié, promettant des expériences de conversation plus naturelles et rapides. Nova Sonic inclut des fonctionnalités telles que l'appel de fonctions, les flux de travail agentiques et l'intégration transparente avec des services externes et des API. Actuellement prenant en charge l'anglais américain et britannique, des plans sont prévus pour étendre ses capacités linguistiques dans un avenir proche.
Le modèle est démontré dans des scénarios de service client dans le secteur des télécommunications, mettant en valeur sa capacité à suivre le sentiment et à interagir efficacement avec les agents humains. Nova Sonic est actuellement disponible dans la région AWS US East (N. Virginia) et est intégré avec des outils spécifiques de support SDK AWS. Danilo Poccia d'Amazon souligne que Nova Sonic fusionne les fonctions vocales en un modèle unique, en faisant un progrès significatif dans la technologie de l'IA.
Du côté de Google Cloud, des mises à jour passionnantes ont été annoncées pour Vertex AI, une plateforme qui se distingue désormais par ses modèles génératifs uniques couvrant divers types de médias tels que la vidéo, l'image, la parole et la musique. Parmi les mises à jour, Lyria, un outil de génération de musique à partir de texte, est actuellement en aperçu privé. Veo 2 présente de nouvelles capacités de montage vidéo, Chirp 3 permet la création de voix personnalisées à partir d'un extrait audio de seulement 10 secondes, et Imagen 3 offre des fonctionnalités améliorées d'édition et de restauration d'image. Ces avancées placent Vertex AI dans une position unique en tant que plateforme complète capable de gérer plusieurs formes de génération de médias.
À travers ces mises à jour et ces lancements, Amazon et Google repoussent les limites de ce qui est possible dans le domaine de l'IA générative. Ces innovations devraient favoriser de nouvelles applications dans divers secteurs, facilitant des interactions homme-machine plus naturelles et enrichissant la création de contenu multimédia. Alors que les deux entreprises continuent de développer et d'élargir leurs offres, les implications pour la technologie de l'IA et son intégration dans les opérations et services quotidiens sont substantielles.