L’IA photonique : une densité de calcul 100 fois supérieure

L'IA photonique : une densité de calcul 100 fois supérieure

Alors que la puissance de traitement nécessaire pour les tâches d’intelligence artificielle (IA) double environ tous les 3,5 mois, les chercheurs cherchent constamment de nouvelles approches pour répondre à cette demande croissante. Une équipe de chercheurs de l’Université d’Oxford, en collaboration avec les Universités de Muenster, Heidelberg et Exeter, a récemment fait un pas en avant significatif dans cette direction.

L’approche photonique

Les chercheurs ont développé un matériel intégré photonique-électronique capable de traiter des données tridimensionnelles (3D), augmentant considérablement le parallélisme du traitement des données pour les tâches d’IA. Cette approche utilise la lumière au lieu de l’électronique, permettant d’effectuer plusieurs calculs en parallèle en utilisant différentes longueurs d’onde pour représenter différents ensembles de données.

En 2021, plusieurs des mêmes auteurs ont démontré une forme de puce de traitement photonique intégrée qui pouvait effectuer une multiplication de matrices vectorielles (une tâche cruciale pour les applications d’IA et d’apprentissage automatique) à des vitesses bien supérieures aux approches électroniques les plus rapides.

Ce travail a donné naissance à Salience Labs, une entreprise d’IA photonique issue de l’Université d’Oxford.

Vers un parallélisme accru

La nouvelle avancée de l’équipe consiste à ajouter une dimension parallèle supplémentaire à la capacité de traitement de leurs puces multiplicatrices de matrices vectorielles photoniques. Ce traitement « à dimension supérieure » est rendu possible en exploitant plusieurs fréquences radio différentes pour coder les données, propulsant le parallélisme à un niveau bien au-delà de ce qui avait été précédemment réalisé.

En guise de test, l’équipe a appliqué leur nouveau matériel à la tâche d’évaluation du risque de mort subite à partir d’électrocardiogrammes de patients atteints de maladies cardiaques. Ils ont réussi à analyser simultanément 100 signaux d’électrocardiogramme, identifiant le risque de mort subite avec une précision de 93,5%.

En synthèse

Les chercheurs estiment qu’avec une mise à l’échelle modérée de 6 entrées × 6 sorties, cette approche peut surpasser les processeurs électroniques de pointe, offrant potentiellement une amélioration de 100 fois en termes d’efficacité énergétique et de densité de calcul. L’équipe prévoit une amélioration supplémentaire du parallélisme informatique à l’avenir, en exploitant davantage de degrés de liberté de la lumière, tels que la polarisation et le multiplexage de mode.

Le Dr Bowei Dong, premier auteur de l’étude, a déclaré : « Nous supposions auparavant que l’utilisation de la lumière au lieu de l’électronique ne pouvait augmenter le parallélisme que par l’utilisation de différentes longueurs d’onde, mais nous avons alors réalisé que l’utilisation de fréquences radio pour représenter les données ouvre une autre dimension, permettant un traitement parallèle ultra-rapide pour le matériel d’IA émergent. »

Le professeur Harish Bhaskaran, qui a dirigé le travail, a ajouté : « C’est une période passionnante pour faire de la recherche sur le matériel d’IA à l’échelle fondamentale, et ce travail est un exemple de la façon dont ce que nous supposions être une limite peut être encore dépassé. »

Pour une meilleure compréhension

1. Qu’est-ce que le matériel intégré photonique-électronique ?

C’est un type de matériel qui utilise la lumière (photonique) au lieu de l’électronique pour traiter les données. Il permet d’effectuer plusieurs calculs en parallèle en utilisant différentes longueurs d’onde pour représenter différents ensembles de données.

2. Qu’est-ce que la multiplication de matrices vectorielles ?

C’est une tâche cruciale pour les applications d’IA et d’apprentissage automatique. Elle consiste à multiplier une matrice par un vecteur, ce qui est une opération fondamentale dans de nombreux algorithmes d’IA.

3. Qu’est-ce que le traitement “à dimension supérieure” ?

Il s’agit d’une méthode qui utilise plusieurs fréquences radio différentes pour coder les données, ce qui permet d’augmenter le parallélisme du traitement des données.

4. Comment le matériel intégré photonique-électronique a-t-il été testé ?

Il a été utilisé pour évaluer le risque de mort subite à partir d’électrocardiogrammes de patients atteints de maladies cardiaques. L’équipe a réussi à analyser simultanément 100 signaux d’électrocardiogramme, identifiant le risque de mort subite avec une précision de 93,5%.

5. Quels sont les avantages potentiels de cette approche ?

Avec une mise à l’échelle modérée, cette approche peut surpasser les processeurs électroniques de pointe, offrant potentiellement une amélioration de 100 fois en termes d’efficacité énergétique et de densité de calcul.

Légende illustration principale : Représentation artistique d’une puce photonique dont les données sont codées à la fois par la lumière et par la fréquence RF. Crédit photo : B.Dong / Université d’Oxford.

L’étude “Higher-dimensional processing using a photonic tensor core with continuous-time data” a été publiée dans Nature Photonics.

[ Rédaction ]

Articles connexes