
Meta Dévoile Llama 4, Faisant Progressivement de l'IA Accessible
Meta a franchi une nouvelle étape dans l'intelligence artificielle avec l'annonce de Llama 4, une suite de modèles avancés conçus pour améliorer l'accessibilité et l'efficacité de l'IA. Cette nouvelle gamme inclut les modèles Scout et Maverick et met en lumière l'engagement continu de la société envers les solutions open-source. Un modèle avec 2 000 milliards de paramètres est également en préparation, promettant encore plus de progrès (VentureBeat).
Le modèle Maverick de Llama 4 dispose de 400 milliards de paramètres impressionnants, tandis que le Scout en a 109 milliards. Ces modèles se distinguent par leurs capacités multimodales, traitant non seulement du texte mais aussi des vidéos et des images. Notamment, ils sont équipés de fenêtres de contexte longues, pouvant accueillir 1 million de jetons pour Maverick et 10 millions de jetons remarquables pour Scout. De telles caractéristiques sont facilitées par une architecture « mixture-of-experts (MoE) », qui active uniquement les composants nécessaires du modèle pour chaque tâche, améliorant ainsi l'efficacité.
Meta vise à être le leader de l'IA en priorisant l'accessibilité et le rapport coût-efficacité. Les modèles sont open-source, permettant aux chercheurs et entreprises de les utiliser et de les développer sans se soucier des APIs hébergées ou des niveaux de tarification à ce stade. Llama 4 Maverick estime des coûts d'inférence entre 0,19 $ et 0,49 $ par million de jetons, ce qui le rend plus abordable comparé à certains modèles propriétaires. Carl Franzen explique que la stratégie de Meta a toujours été de proposer des modèles open-source de premier plan à la communauté pour une exploration et un développement libres.
Ces modèles exploitent une méthode novatrice appelée MetaP pour ajuster et transférer efficacement les hyperparamètres à travers différentes tailles de modèles, optimisant la performance de l'entraînement. Bien que les modèles Llama 4 excellent dans les tâches de raisonnement, de codage et de résolution de problèmes, ils ne mettent pas l'accent sur les processus de chaîne de pensée comme ceux observés chez les rivaux tels que la série o d'OpenAI ou DeepSeek R1.
Les efforts de benchmarking ont démontré que le Llama 4 Behemoth résiste fortement face à DeepSeek R1, soulignant sa performance robuste à travers diverses métriques tout en laissant encore de la place à l'amélioration.
Meta accorde une grande importance à la sécurité de l'IA et à la réduction des biais, en utilisant des outils tels que Llama Guard et Prompt Guard. De plus, les exercices de red-teaming garantissent que la technologie est rigoureusement testée et affinée avant un lancement plus large.
Le lancement de Llama 4 pourrait marquer un changement significatif dans le paysage de l'IA, en offrant une alternative open-source convaincante aux modèles propriétaires établis des géants de l'industrie comme OpenAI et DeepSeek. Mark Zuckerberg a réitéré la vision de Meta de rendre l'IA avancée universellement accessible et bénéfique.
Avec Llama 4, Meta vise non seulement à rester pertinent dans l'industrie de l'IA à rythme rapide, mais aussi à mener la charge pour favoriser un environnement inclusif pour l'innovation. Ce mouvement souligne l'engagement de Meta envers une IA open-source et abordable, influençant potentiellement la manière dont les technologies de l'IA évoluent et s'intègrent dans les applications quotidiennes.