Des milliers de travailleurs précaires dans plus de 50 pays, principalement en développement, génèrent des données vidéo domestiques pour l’apprentissage des robots humanoïdes. Rémunérés environ 15 dollars de l’heure, ils cèdent leurs images personnelles sans pleine conscience des implications, tandis que les entreprises de robotique comme Tesla et Figure AI préparent l’automatisation des tâches manuelles qu’ils accomplissent.
Dans les pays du Sud, une nouvelle forme de travail émerge, invisible mais déterminante pour l’avenir de l’automatisation. Des milliers de personnes, souvent dans des situations économiques précaires, s’attachent des smartphones sur le front pour filmer leurs gestes quotidiens : plier du linge, éplucher des légumes, ranger la vaisselle. Ces séquences, vendues par des plateformes comme Micro1 ou Scale AI, constituent la matière première indispensable à l’entraînement des robots humanoïdes. Une économie paradoxale se développe ainsi, où les travailleurs alimentent les systèmes qui pourraient un jour les remplacer.
La quête des données corporelles
L’enjeu technique est de taille. Contrairement aux modèles de langage qui s’appuient sur des textes disponibles en ligne, les robots humanoïdes nécessitent des images spécifiques, montrant des mains humaines interagissant avec des objets dans des environnements domestiques réels. « La robotique ne dispose pas d’internet comme ensemble de données prêt à l’emploi, il faut générer les données d’entraînement à partir de zéro dans le monde réel, ce qui est beaucoup plus difficile », explique Ulrik Hansen, cofondateur de la startup d’annotation de données Encord. Cette difficulté explique la course aux images authentiques, capturées dans des cuisines et des salons plutôt que dans des laboratoires aseptisés.
Les entreprises mobilisées sont diverses :
- Micro1, basée à Palo Alto, emploie des milliers de contractuels en Inde, au Nigeria et en Argentine
- Scale AI a accumulé environ 100 000 heures de séquences vidéo
- DoorDash a lancé l’application Tasks pour ses livreurs américains
- La startup Sunain recrute à Los Angeles des contributeurs équipés de caméras au poignet
Un consentement en pointillé
La rémunération, autour de 15 dollars de l’heure, représente une somme attractive dans des économies en développement. Mais l’attrait financier masque des conditions contractuelles souvent opaques. Les travailleurs disposent d’une visibilité limitée sur l’utilisation future de leurs images. Le MIT Technology Review rapporte que lorsque des employés de Micro1 ont demandé via le canal Slack interne si l’entreprise pouvait supprimer leurs données, celle-ci a refusé de commenter ses politiques de suppression.
L’opacité est d’autant plus préoccupante que les juridictions les plus protectrices sont parfois exclues des programmes. DoorDash a ainsi volontairement laissé de côté la Californie, New York, Seattle et le Colorado des États dotés de législations avancées sur la protection des données et les droits des travailleurs de plateforme.
Le paradoxe de l’automatisation
La situation crée une tension fondamentale. Les travailleurs enseignent aux machines les gestes qui constituent le cœur de leur activité professionnelle : manipulation d’objets, préparation alimentaire, nettoyage. Ces compétences, une fois numérisées et intégrées dans des systèmes robotiques, pourraient rendre obsolètes les emplois dont elles sont issues. Tesla, Figure AI et Agility Robotics testent déjà des prototypes dans des environnements industriels, préparant le terrain pour une automatisation plus poussée.
Le chercheur en robotique Prather résume la contradiction : « Cela va être étrange », déclare-t-il au MIT Technology Review, évoquant l’ampleur du travail manuel nécessaire pour réaliser la robotique autonome. Le paradoxe est double. Non seulement les travailleurs participent à leur propre remplacement potentiel, mais ils le font souvent sans pleine conscience des implications à long terme de leur contribution.
La demande en données devrait même s’intensifier. Les robots humanoïdes pourraient nécessiter davantage d’heures d’entraînement que les grands modèles de langage, selon les estimations. La croissance anticipée signifie que le secteur du micro-travail lié à la collecte de données vidéo devrait se développer avant même que les robots qu’il alimente ne soient opérationnels à grande échelle.
La dynamique engendrée ici pose surtout des questions éthiques profondes sur la propriété des données corporelles, le consentement éclairé dans des contextes de précarité économique, et la responsabilité des entreprises technologiques dans la transition vers l’automatisation. Alors que les robots apprennent à plier une chemise ou à émincer un oignon, ce sont des relations sociales complexes qui se reconfigurent, souvent au détriment des plus vulnérables.




















