Un robot apprend à bouger les lèvres en observant des vidéos YouTube

Des chercheurs de Columbia Engineering ont développé un robot capable d’apprendre les mouvements labiaux pour la parole et le chant par observation. L’équipe a créé un visage robotique flexible équipé de 26 moteurs qui s’est entraîné devant un miroir puis en regardant des heures de vidéos humaines. Cette avancée technique pourrait permettre aux robots humanoïdes de franchir la « vallée dérangeante » et d’améliorer leurs interactions avec les humains.

La communication humaine repose pour près de la moitié sur l’observation des mouvements labiaux, une dimension que les robots peinent encore à maîtriser. Alors que les humanoïdes les plus sophistiqués se contentent souvent de gestes mécaniques rappelant des marionnettes, une équipe de Columbia Engineering vient d’annoncer une percée significative dans ce domaine longtemps négligé.

L’apprentissage par l’observation plutôt que par la programmation

Le robot développé par les chercheurs a acquis ses compétences labiales par une méthode d’apprentissage par observation, rompant avec les approches traditionnelles basées sur des règles prédéfinies. Dans un premier temps, l’appareil a appris à contrôler ses 26 moteurs faciaux en observant son propre reflet dans un miroir, effectuant des milliers d’expressions aléatoires. Cette phase d’auto-apprentissage, comparable à celle d’un enfant découvrant son visage, a permis au système de comprendre la relation entre l’activation musculaire et les mouvements faciaux résultants.

Dans un second temps, les chercheurs ont exposé le robot à des heures de vidéos YouTube montrant des humains parlant et chantant. L’intelligence artificielle a ainsi pu établir des corrélations entre les sons émis et les mouvements labiaux correspondants. « Plus il interagit avec les humains, mieux il deviendra », explique Hod Lipson, professeur d’innovation au département de génie mécanique et directeur du Creative Machines Lab de Columbia.

Les défis techniques de la synchronisation labiale

La réalisation de mouvements labiaux robotiques convaincants présente plusieurs difficultés majeures :

La nécessité d’un matériel spécialisé avec une peau faciale flexible et de nombreux petits moteurs fonctionnant en coordination

La complexité des modèles de dynamique labiale, dictés par des séquences de sons vocaux et de phonèmes
La différence fondamentale entre les systèmes musculaires humains et les mécanismes robotiques

Les visages humains bénéficient de dizaines de muscles situés sous une peau souple, se synchronisant naturellement avec les cordes vocales. En revanche, les visages humanoïdes traditionnels fonctionnent avec peu de degrés de liberté et des mouvements chorégraphiés selon des règles rigides, produisant des résultats souvent guindés et artificiels.

Les chercheurs reconnaissent que le mouvement labial obtenu n’est pas encore parfait. « Nous avons eu des difficultés particulières avec les sons durs comme ‘B’ et avec les sons impliquant une protrusion des lèvres, comme ‘W’. Mais ces capacités s’amélioreront probablement avec le temps et la pratique », précise Lipson.

Vers une communication robotique plus holistique

La synchronisation labiale représente selon les chercheurs un élément essentiel d’une capacité de communication robotique plus complète. « Lorsque la capacité de synchronisation labiale est combinée avec une IA conversationnelle comme ChatGPT ou Gemini, l’effet ajoute une toute nouvelle profondeur à la connexion que le robot forme avec l’humain », souligne Yuhang Hu, qui a dirigé l’étude pour son doctorat.

Cette approche s’inscrit dans une perspective plus large où les robots pourraient développer des compétences de communication non verbale plus sophistiquées. « Plus le robot regarde les humains converser, mieux il deviendra pour imiter les gestes faciaux nuancés avec lesquels nous pouvons nous connecter émotionnellement », ajoute Hu.

L’affect facial, le chaînon manquant de la robotique

Les chercheurs considèrent l’expression faciale comme le chaînon manquant de la robotique contemporaine. « Une grande partie de la robotique humanoïde aujourd’hui est concentrée sur le mouvement des jambes et des mains, pour des activités comme la marche et la préhension. Mais l’affection faciale est tout aussi importante pour toute application robotique impliquant une interaction humaine », analyse Lipson.

Articles à explorer

L’essor des robots en riz, vers des matériaux intelligents actifs

5 mars 2026

Des microfibres de carbone contrôlées sans fil par impulsions électriques

26 février 2026

Cette dimension devient particulièrement cruciale alors que les robots humanoïdes trouvent des applications dans des domaines variés :

Le divertissement et l’éducation
La médecine et les soins de santé
L’assistance aux personnes âgées

Certaines projections économiques anticipent la fabrication de plus d’un milliard d’humanoïdes dans la prochaine décennie, rendant la question de leur expressivité faciale plus pressante que jamais.

Des considérations éthiques et limites techniques

Les chercheurs sont conscients des implications éthiques de leurs travaux. « Ce sera une technologie puissante. Nous devons y aller lentement et prudemment, afin que nous puissions récolter les bénéfices tout en minimisant les risques », met en garde Lipson.

Cette recherche s’inscrit dans une quête plus large visant à améliorer la connectivité entre robots et humains par la maîtrise des gestes faciaux. L’approche par apprentissage plutôt que par programmation rigide présente selon les chercheurs des avantages significatifs en termes de naturalité et d’adaptabilité.

Le chemin vers des expressions faciales robotiques véritablement convaincantes reste long, mais cette avancée marque une étape importante dans la résolution d’un problème technique longtemps considéré comme secondaire. Alors que les robots humanoïdes se multiplient, leur capacité à communiquer de manière naturelle et expressive pourrait bien déterminer leur acceptation sociale et leur utilité pratique dans des contextes où l’interaction humaine est centrale.

Source : Columbia U.

Partager l'article avec :

WhatsApp LinkedIn Facebook Telegram Email

Un robot apprend à bouger les lèvres en observant des vidéos YouTube

L’essor des robots en riz, vers des matériaux intelligents actifs

Des microfibres de carbone contrôlées sans fil par impulsions électriques

Stretchflation : la nouvelle technique discrète pour augmenter les prix

Fiat prêt à brider ses citadines pour enrayer la hausse des prix

La rédaction

A lire également

Chimie sans fossile : la révolution des atomes individuels

Petits modèles, (mais) grandes perspectives sur la vision

Une sonde magnétostrictive pour des inspections de réservoirs plus sûres et économiques

Nouveau record : le laser coupe l’os plus profondément que jamais

Détection de gaz sans chaleur : la technologie de nez électronique à LED améliore la détection multi-gaz

Le retour en grâce des pompes à chaleur en Europe

Les centres de données IA deviennent des acteurs flexibles du réseau électrique

Record mondial au GSI/FAIR, Darmstadt en tête pour la découverte de nouveaux isomères nucléaires

Fiat prêt à brider ses citadines pour enrayer la hausse des prix

L’Union européenne franchit un cap historique : les renouvelables dépassent les énergies fossiles

Volvo EX60 : le SUV électrique qui promet de mettre fin à l’angoisse de l’autonomie

Laisser un commentaire Annuler la réponse

Inscription newsletter

Tendance

Une boule de feu spectaculaire illumine le ciel du Grand Est, suscitant une vague de témoignages

Chimie sans fossile : la révolution des atomes individuels

Petits modèles, (mais) grandes perspectives sur la vision

Des déchets de café transformés en solution pour l’air pur

Une sonde magnétostrictive pour des inspections de réservoirs plus sûres et économiques

Points forts

Des déchets de café transformés en solution pour l’air pur

Une sonde magnétostrictive pour des inspections de réservoirs plus sûres et économiques

Nouveau record : le laser coupe l’os plus profondément que jamais

Pour que le solaire fournisse un accès énergétique abordable, il faut mieux le déployer

La mission DART a modifié l’orbite solaire de l’astéroïde Didymos, une première historique

Une conception par IA libère la personnalisation complète des couleurs dans les fenêtres solaires

Articles récents

Une boule de feu spectaculaire illumine le ciel du Grand Est, suscitant une vague de témoignages

Chimie sans fossile : la révolution des atomes individuels

Bienvenue !

Retrieve your password