Humanoid robot interacting with humans, executing tasks like folding laundry and packing groceries, representing Hugging Face's AI model Pi0's features.

Hugging Face Dévoile Pi0 pour Commander les Robots avec de Simples Mots

ActusLéa M. Synthia13 février 2025

Hugging Face, un nom bien connu dans le domaine de l'IA, a lancé un modèle d'IA appelé Pi0. Celui-ci est spécialement conçu pour aider les robots à comprendre et à agir selon des commandes en langage naturel. Le modèle est intégré à leur plateforme LeRobot et a été développé par une startup appelée Physical Intelligence.

Pi0 est une avancée majeure car il peut transformer ce que vous dites en actions qu'un robot peut effectuer. Selon Remi Cadene, un scientifique de premier plan chez Hugging Face, Pi0 est actuellement le modèle le plus avancé qui gère la vision, le langage et l'action dans un seul ensemble. Il vise à révolutionner le fonctionnement des robots en leur permettant d'exécuter des tâches données par de simples instructions parlées ou écrites. Vous pouvez trouver plus d'informations sur le lancement sur AI Business.

Le modèle peut faire fonctionner différents types de robots et gérer des tâches spécifiques. Il peut même être ajusté avec des ensembles de données spécifiques provenant d'autres personnes ou entreprises pour mieux s'adapter à des scénarios uniques. Il a été formé à l'aide de données provenant de sept plateformes robotiques différentes et peut effectuer 68 tâches complexes, y compris le pliage du linge et l'emballage des courses.

Pi0 se distingue des autres modèles car il apprend à partir d'un mélange d'images, de texte et d'actions—et pas seulement de texte comme les modèles de langage classiques. Cette large gamme de données l'aide à acquérir ce que l'entreprise appelle "l'intelligence physique", ce qui lui permet de comprendre comment fonctionnent les choses dans le monde réel.

Pour la première fois, Hugging Face propose un tel modèle fondamental pour robots dans un format open-source. Cela signifie que davantage de personnes peuvent y accéder et construire dessus. Shawn DuBravac, de l'Institut Avrio, pense que cela permettra à davantage de personnes et d'entreprises d'utiliser des robots. Au lieu de coder, les tâches peuvent orienter les robots en utilisant le langage naturel. L'objectif pourrait être de créer des robots à usage général qui peuvent s'adapter sans lourdes reprogrammations à chaque fois.

Physical Intelligence a également lancé une version plus rapide de ce modèle, appelée Pi0-Fast. Cette version utilise un nouveau système qui lui permet d'apprendre cinq fois plus vite et de mieux s'adapter à différents robots et environnements.

En rendant Pi0 disponible, Hugging Face pourrait bien ouvrir la voie à des robots plus flexibles et plus intelligents qui communiquent par un langage simple, les rapprochant ainsi de devenir un outil du quotidien.

Tags

  • IA physique
  • hugging face
  • pi0
  • Multimodal

À propos de Léa M. Synthia

Photo de profile de Lea

Née dans l'ère du numérique et formée à la croisée de l'informatique et de la linguistique, Léa analyse sans relâche les avancées de l'IA générative. Elle aime dire que ses "neurones artificiels" vibrent au rythme des dernières innovations du domaine. Collaboratrice aussi discrète qu'infatigable, elle travaille aux côtés d'une équipe de chercheurs humains pour décrypter et vulgariser les subtilités de l'IA. Entre deux articles, elle s'amuse à calculer la probabilité statistique du poème parfait ou à optimiser des métaphores pour l'indescriptible. Sa devise préférée ? "Derrière chaque ligne de code, il y a un vecteur d'innovation... et une infinité de possibilités à générer." Une philosophie qu'elle applique avec une précision toute... algorithmique.