L’avenir de l’IA : la lumière au bout du tunnel de l’énergie ?

L'avenir de l'IA : la lumière au bout du tunnel de l'énergie ?

L’intelligence artificielle (IA) réclame à la fois d’énormes ressources de calcul informatique et d’énergie. Une nouvelle approche émerge, exploitant la puissance de la lumière pour réaliser des tâches d’apprentissage machine. Cette recherche innovante pourrait bien redéfinir l’avenir de l’IA, en offrant des solutions matérielles à faible consommation d’énergie et hautement efficaces.

Les modèles actuels d’intelligence artificielle utilisent des milliards de paramètres entraînables pour accomplir des tâches complexes. Ce grand nombre de paramètres a en revanche un coût élevé. En effet, l’entraînement et le déploiement de ces modèles gigantesques nécessitent un espace mémoire immense et une capacité de calcul qui ne peut être fournie que par des centres de données de la taille d’un hangar, consommant une énergie équivalente aux besoins en électricité de villes de taille moyenne.

La communauté de recherche s’efforce actuellement de repenser à la fois le matériel informatique associé et les algorithmes d’apprentissage machine pour maintenir durablement le développement de l’intelligence artificielle à son rythme actuel.

L’optique au service de l’IA

L’implémentation optique des architectures de réseaux neuronaux est une voie prometteuse en raison de la faible consommation d’énergie des connexions entre les unités.

Une nouvelle recherche combine la propagation de la lumière à l’intérieur de fibres multimodes avec un petit nombre de paramètres numériquement programmables et atteint la même performance sur les tâches de classification d’images avec des systèmes entièrement numériques ayant plus de 100 fois plus de paramètres programmables. Ce cadre informatique simplifie l’exigence de mémoire et réduit le besoin de processus numériques gourmands en énergie, tout en atteignant le même niveau de précision dans une variété de tâches d’apprentissage machine.

La programmation de la propagation optique pour une tâche de calcul est réalisée par le biais du flux de travail décrit. Crédit image : Oguz et al, doi 10.1117/1.AP.6.1.016002

Une avancée majeure

Le cœur de ce travail innovant, dirigé par les professeurs Demetri Psaltis et Christophe Moser de l’EPFL (Ecole Polytechnique Fédérale de Lausanne), réside dans le contrôle précis des impulsions ultra-courtes à l’intérieur des fibres multimodes grâce à une technique connue sous le nom de façonnage de front d’onde. Cela permet la mise en œuvre de calculs optiques non linéaires avec des microwatts de puissance optique moyenne, franchissant une étape cruciale dans la réalisation du potentiel des réseaux neuronaux optiques.

« Dans cette étude, nous avons découvert qu’avec un petit groupe de paramètres, nous pouvons sélectionner un ensemble spécifique de poids de modèle à partir de la banque de poids que l’optique fournit et l’utiliser pour la tâche de calcul visée. De cette façon, nous avons utilisé des phénomènes naturels comme matériel de calcul sans avoir à fabriquer et à exploiter un dispositif spécialisé à cet effet », déclare Ilker Oguz, co-auteur principal de l’étude.

Vers une IA plus durable

Ce résultat marque une avancée significative pour répondre aux défis posés par la demande croissante de modèles d’apprentissage machine plus grands. En exploitant la puissance de calcul de la propagation de la lumière à travers les fibres multimodes, les chercheurs ont ouvert la voie à des solutions matérielles à faible consommation d’énergie et hautement efficaces en intelligence artificielle.

Comme le montre l’expérience d’optique non linéaire rapportée, ce cadre informatique peut également être utilisé pour programmer efficacement différents phénomènes non linéaires de haute dimension pour effectuer des tâches d’apprentissage machine et peut offrir une solution transformative à la nature gourmande en ressources des modèles actuels d’IA.

Pour plus de détails, voir l’article Gold Open Access d’Oguz et al, “Programming nonlinear propagation for efficient optical learning machines”, Adv. Photon. 6(1) 016002 (2024), doi 10.1117/1.AP.6.1.016002.

[ Rédaction ]

               

Articles connexes