IBM NorthPole : la puce d’IA 25 fois plus économe en énergie

IBM NorthPole : la puce d'IA 25 fois plus économe en énergie

Nous vivons une époque fascinante où l’intelligence artificielle (IA) est en pleine expansion. Au cours de la dernière décennie, l’IA est passée de la théorie et de petits tests à des cas d’utilisation à l’échelle de l’entreprise. Le matériel utilisé pour exécuter les systèmes d’IA, bien qu’il soit de plus en plus puissant, n’a pas été conçu en pensant à l’IA d’aujourd’hui. Alors que les systèmes d’IA évoluent, les coûts grimpent en flèche. Et la loi de Moore, la théorie selon laquelle la densité des circuits dans les processeurs doublerait chaque année, a ralenti.

Mais une nouvelle recherche menée par le laboratoire de recherche d’IBM à Almaden, en Californie, qui a nécessité près de deux décennies de travail, a le potentiel de changer radicalement la manière dont nous pouvons augmenter efficacement la puissance des systèmes matériels d’IA.

Le défi de l’informatique moderne

Depuis ses débuts, l’informatique a été centrée sur le processeur, avec une mémoire séparée du calcul. En revanche, le transfert de grandes quantités de données entre la mémoire et le calcul a un coût élevé en termes de consommation d’énergie et de bande passante et de vitesse de traitement. Cela est particulièrement évident dans le cas des applications d’intelligence artificielle (IA) avancées et émergentes en temps réel, comme la reconnaissance faciale, la détection d’objets et la surveillance du comportement, qui nécessitent un accès rapide à de vastes quantités de données.

En conséquence, la plupart des architectures informatiques contemporaines atteignent rapidement des goulots d’étranglement physiques et de traitement et risquent de devenir économiquement, techniquement et écologiquement insoutenables, compte tenu des coûts énergétiques croissants impliqués.

NorthPole : une solution inspirée du cerveau

Inspiré par l’architecture neuronale du cerveau organique, Dharmendra Modha du centre de recherche d’IBM à San José en Californie et ses collègues ont développé NorthPole – une architecture d’inférence neuronale qui entrelace le calcul avec la mémoire sur une seule puce. Selon les auteurs, NorthPole « réinvente l’interaction entre le calcul et la mémoire » en mélangeant l’informatique inspirée du cerveau et la technologie des semi-conducteurs.

Elle offre des performances, une efficacité énergétique et une efficacité de surface supérieures par rapport à d’autres architectures comparables, y compris celles qui utilisent des processus technologiques plus avancés. Et, parce que NorthPole est un système numérique, il n’est pas sujet au bruit de l’appareil et aux biais et dérives systémiques qui affectent les systèmes analogiques.

La puce NorthPole sur une carte PCIe. Credit IBM

Des performances éprouvées

Les chercheurs démontrent les capacités de NorthPole en le testant sur le réseau de classification d’images de référence ResNet50, où il a atteint 25 fois la métrique d’énergie supérieure de frames par seconde (FPS) par watt, une métrique d’espace 5 fois supérieure de FPS par transistor, et une métrique de temps 22 fois inférieure de latence par rapport à une technologie comparable.

Dans une perspective connexe, Subramanian Iyer et Vwani Roychowdhury discutent des avancées et des limites de NorthPole en détail.

Comment NorthPole parvient à une telle efficacité ?

L’une des plus grandes différences avec NorthPole est que toute la mémoire pour le dispositif est sur la puce elle-même, plutôt que connectée séparément. Sans ce goulot d’étranglement de von Neumann, la puce peut effectuer des inférences d’IA beaucoup plus rapidement que les autres puces déjà sur le marché.

NorthPole a été fabriqué avec un processus de nœud de 12 nm, et contient 22 milliards de transistors dans 800 millimètres carrés. Il dispose de 256 cœurs et peut effectuer 2 048 opérations par cœur par cycle à une précision de 8 bits, avec la possibilité de doubler et de quadrupler le nombre d’opérations avec une précision de 4 bits et 2 bits, respectivement. « C’est un réseau entier sur une puce », s’est exclamée Dharmendra Modha.

Applications potentielles de NorthPole

Alors que la recherche sur la puce NorthPole est toujours en cours, sa structure se prête à des cas d’utilisation émergents de l’IA, ainsi qu’à des cas plus établis. Lors des tests, l’équipe de NorthPole s’est principalement concentrée sur des utilisations liées à la vision par ordinateur, en partie parce que le financement du projet provenait du département de la Défense des États-Unis.

Certaines des principales applications envisagées étaient la détection, la segmentation d’images et la classification vidéo. Mais elle a également été testée dans d’autres domaines, tels que le traitement du langage naturel (sur le modèle BERT à encodeur uniquement) et la reconnaissance vocale (sur le modèle DeepSpeech2).

En synthèse

NorthPole représente une étape importante dans la recherche d’une informatique plus éco-énergétique. En ré-imaginant l’interaction entre la mémoire et le calcul, cette architecture de puce inspirée du cerveau pourrait bien ouvrir la voie à une nouvelle génération de systèmes informatiques plus efficaces et plus respectueux de l’environnement.

L’état actuel de l’art pour les CPU est de 3 nm – et IBM lui-même est déjà depuis plusieurs années dans la recherche sur les nœuds de 2 nm. Cela signifie qu’il y a une poignée de générations de technologies de traitement de puces sur lesquelles NorthPole pourrait être mis en œuvre, en plus des innovations architecturales fondamentales, pour continuer à trouver des gains d’efficacité et de performance.

Pour une meilleure compréhension

Qu’est-ce que NorthPole ?

NorthPole est une architecture de puce inspirée du cerveau qui entrelace le calcul avec la mémoire sur une seule puce, offrant une efficacité énergétique et de surface supérieures.

Qui sont les créateurs de NorthPole ?

NorthPole a été développé par des chercheurs d’IBM Research, dans le domaine de l’informatique et de l’intelligence artificielle.

Quels sont les avantages de NorthPole ?

NorthPole offre des performances, une efficacité énergétique et une efficacité de surface supérieures par rapport à d’autres architectures comparables. De plus, étant un système numérique, il n’est pas sujet au bruit de l’appareil et aux biais et dérives systémiques qui affectent les systèmes analogiques.

Comment NorthPole a-t-il été testé ?

NorthPole a été testé sur le réseau de classification d’images de référence ResNet50, où il a démontré une performance supérieure en termes de métriques d’énergie, d’espace et de temps.

Comment NorthPole diffère-t-elle des autres puces d’IA ?

NorthPole diffère des autres puces d’IA en ce sens que toute la mémoire pour le dispositif est sur la puce elle-même, plutôt que connectée séparément. Cela lui permet d’effectuer des inférences d’IA beaucoup plus rapidement que les autres puces déjà sur le marché.

Quelle est l’efficacité de NorthPole par rapport aux autres puces d’IA ?

NorthPole est nettement plus efficace que les GPU courants de 12 nm et les CPU de 14 nm. Dans les deux cas, NorthPole est 25 fois plus économe en énergie, en ce qui concerne le nombre d’images interprétées par joule d’énergie nécessaire.

Quelles sont les applications potentielles de NorthPole ?

NorthPole peut être utilisé dans divers domaines, y compris la vision par ordinateur, le traitement du langage naturel et la reconnaissance vocale. Il peut également être utilisé dans des applications de pointe qui nécessitent une grande quantité de traitement de données en temps réel.

Quelle est la prochaine étape pour NorthPole ?

La prochaine étape pour NorthPole est de montrer ce qu’elle peut faire, tout en explorant comment traduire les conceptions en processus de production de puces plus petits et en explorant davantage les possibilités architecturales.

Article : “Neural inference at the frontier of energy, space, and time” – DOI: 10.1126/science.adh1174

[ Rédaction ]

Articles connexes