L’institut de recherche Toyota (TRI) a récemment annoncé une approche innovante basée sur la politique de diffusion pour enseigner rapidement et efficacement de nouvelles compétences complexes aux robots.
Cette avancée pourrait transformer l’utilité des robots et constitue un pas vers la création de « modèles de comportement à grande échelle » (LBMs) pour les robots, similaires aux « modèles de langage à grande échelle » (LLMs) qui ont révolutionné l’intelligence artificielle conversationnelle.
Une nouvelle méthode d’enseignement pour les robots
Le but de la recherche en robotique chez TRI est d’amplifier les capacités humaines plutôt que de les remplacer, selon Gill Pratt, PDG de TRI et scientifique en chef de Toyota Motor Corporation. La nouvelle technique d’enseignement est à la fois très efficace et produit des comportements performants, permettant aux robots d’assister les humains de manière plus efficace.
Les techniques précédentes pour enseigner de nouveaux comportements aux robots étaient lentes, incohérentes, inefficaces et souvent limitées à des tâches bien définies réalisées dans des environnements très contraints. Les chercheurs en robotique devaient passer de nombreuses heures à écrire du code sophistiqué et/ou à utiliser de nombreux cycles d’essais et d’erreurs pour programmer les comportements.
« Les tâches que je vois ces robots accomplir sont tout simplement stupéfiantes – il y a encore un an, je n’aurais pas prédit que nous étions proches de ce niveau de dextérité« , a remarqué Russ Tedrake, vice-président de la recherche en robotique au TRI.
M. Tedrake, qui est également professeur de génie électrique et d’informatique, d’aéronautique et d’astronautique, et de génie mécanique au MIT, explique : « Ce qui est si passionnant dans cette nouvelle approche, c’est le rythme et la fiabilité avec lesquels nous pouvons ajouter de nouvelles compétences. Comme ces compétences fonctionnent directement à partir des images de la caméra et de la détection tactile, en utilisant uniquement des représentations apprises, elles sont capables de donner de bons résultats même pour des tâches impliquant des objets déformables, des tissus et des liquides, qui ont toujours été extrêmement difficiles pour les robots« .
Des compétences complexes et variées
Grâce à cette nouvelle approche, TRI a déjà enseigné à ses robots plus de 60 compétences complexes, telles que verser des liquides, utiliser des outils et manipuler des objets déformables. Ces réalisations ont été obtenues sans écrire une seule ligne de nouveau code ; le seul changement a été de fournir de nouvelles données au robot.
TRI s’est fixé un objectif ambitieux d’enseigner des centaines de nouvelles compétences d’ici la fin de l’année et 1 000 d’ici la fin de 2024. Les robots pourront ainsi fonctionner dans de nouveaux scénarios et effectuer un large éventail de comportements, interagissant avec le monde de manière variée et riche.
En synthèse
Les progrès réalisés par TRI dans l’enseignement des compétences complexes aux robots pourraient ouvrir la voie à une nouvelle génération de robots capables d’assister les humains dans des situations quotidiennes et des environnements imprévisibles et changeants.
Pour une meilleure compréhension
Qu’est-ce que la politique de diffusion ?
La politique de diffusion est une approche innovante de l’apprentissage des comportements basée sur l’intelligence artificielle générative. Elle permet d’enseigner facilement et rapidement de nouveaux comportements aux robots à partir de démonstrations.
Quelles compétences ont été enseignées aux robots ?
Les robots de TRI ont appris plus de 60 compétences complexes, telles que verser des liquides, utiliser des outils et manipuler des objets déformables.
Quels sont les objectifs de TRI en matière d’enseignement des compétences ?
TRI vise à enseigner des centaines de nouvelles compétences d’ici la fin de l’année et 1 000 d’ici la fin de 2024.
Comment cette approche améliore-t-elle l’enseignement des compétences aux robots ?
Cette approche permet d’enseigner rapidement et efficacement de nouvelles compétences complexes aux robots, sans avoir à écrire de nouvelles lignes de code. Elle produit également des comportements performants et cohérents.
Quelles sont les implications de ces avancées pour l’avenir de la robotique ?
Ces progrès pourraient ouvrir la voie à une nouvelle génération de robots capables d’assister les humains dans des situations quotidiennes et des environnements imprévisibles et changeants, et contribuer à accélérer le développement et l’adoption de la robotique dans divers secteurs.