Helios : de zéro à 1,5 pétaflops en quelques mois

Avec Helios, Bull a déployé un nouveau supercalculateur pétaflopique, cette fois au Japon. Et au-delà de la prouesse technologique, c’est un défi colossal qu’a relevé toute une équipe, comme le raconte le directeur du projet de Bull, Philippe Lachamp.


Dans quel contexte s’inscrit le supercalculateur Helios et à quoi va-t-il servir ?

Helios va contribuer aux grands programmes internationaux de recherche, dont l’objectif est de parvenir à maîtriser la fusion nucléaire comme nouvelle source d’énergie. En France, on connaît bien le réacteur expérimental ITER[1], qui est en cours de construction à Cadarache. Mais il existe d’autres projets associés, dont ceux lancés dans le cadre de l’accord Approche Elargie conclu entre l’Europe et le Japon, qui se déroulent sur le territoire japonais. Implanté à Rokkasho, au Japon : un centre de recherche international spécialisé (IFERC[2]) a été créé, et il héberge un centre de calcul pour la fusion. Le supercalculateur Helios en est le cœur ; il sera utilisé par les différentes équipes de recherche pour résoudre les questions fondamentales que pose la fusion nucléaire dont la stabilité du plasma de fusion ou la conception de matériaux capables d’absorber le neutron émis par la réaction de fusion dans des conditions extrêmes de température et de pression.

Comment s’est effectué le choix de Bull ?

L’Approche Elargie est un programme international qui associe le Japon et l’Europe, représentés par le F4E (Fusion for Energy). Le F4E a mandaté le CEA, acteur français de renom mondial, pour conduire l’appel d’offres international et choisir le meilleur supercalculateur possible, sans oublier l’environnement informatique et les services associés (maintenance et exploitation sur 5 ans). Etant donné les enjeux, la procédure a été stricte et d’une rigueur extrême. Bull l’a emporté notamment en raison des garanties que nous fournissions de pouvoir être prêts pour l’échéance fixée à janvier 2012. Le contrat a été signé en mars 2011, et seul Bull possédait la maîtrise et les ressources techniques nécessaires pour livrer une machine pétaflopique opérationnelle en à peine neuf mois.

Helios : de zéro à 1,5 pétaflops en quelques mois


Quel était le périmètre de votre intervention ?

C’est très simple : nous étions responsables de A à Z de la mise en œuvre d’un supercalculateur de 1,5 pétaflops dans un endroit qui ne comportait au départ que quatre murs, une arrivée d’électricité et une arrivée d’eau. Il a donc fallu commencer par piloter un sous-traitant local pour installer les infrastructures techniques (réseau électrique, climatisation, onduleurs…), puis déployer l’ensemble du système, c’est-à-dire non seulement le supercalculateur proprement dit, avec ses 2 205 lames bullx B510 équipées de processeurs Intel Sandy Bridge®, mais aussi l’infrastructure matérielle et logicielle qui permet de l’utiliser : gestion de fichiers, ordonnancement et exécution des calculs avec bullx supercomputer suite, administration, stockage, archivage, réseau, sécurité, portail utilisateur, outils de visualisation… Enfin, Bull ayant également en charge pour cinq ans l’exploitation, la maintenance et le support de l’installation, il a fallu mettre en place les processus et les ressources indispensables pour pouvoir répondre aux exigences légitimes des utilisateurs d’un tel équipement. Au total, il faut donc s’imaginer un projet d’infrastructure de bout en bout, dont chaque composante se doit d’être au maximum de la technicité, de la performance et de la robustesse possibles aujourd’hui.

Comment s’est déroulé le projet ?

L’équipe projet comptait une douzaine de personnes, appuyées par toute la force de Bull, et notamment les ressources industrielles de l’usine d’Angers. Bull ne possédant pas d’implantation au Japon, une partie de l’équipe a été dépêchée sur place, tandis que l’autre prenait le relais depuis la France. Le décalage horaire s’est d’ailleurs révélé un atout, car il nous a permis de travailler 24 h/24 pendant les deux derniers mois de déploiement.

Il a par ailleurs fallu relever les défis de gouvernance, d’organisation et de compréhension mutuelle propres à ce type de projet international et multiculturel. Et puis il y a eu quelques surprises, comme lorsque nous avons découvert qu’en novembre, tout le fret entre la France et le Japon était réservé au beaujolais nouveau ! Malgré tout, le premier nœud de calcul a été branché le 20 octobre. Deux mois plus tard, il y en avait 4 410. Helios a été recetté comme prévu en décembre dernier après avoir notamment démontré nos engagements sur trois codes de calcul sur 65 536 cœurs de calcul. Helios a été mis en production dès le 12 Janvier 2012 et sera dans un premier temps rôdé par des équipes de recherche de renom international avant d’entrer en production en avril.

Au moment de l’inauguration d’Helios, quel bilan tirez-vous de cette aventure ?

Que c’était une aventure, précisément ! Et que nous avons réussi. C’est une immense fierté d’avoir bâti en si peu de temps, et dans des conditions si particulières, l’un des ordinateurs les plus puissants au monde. La clé a sans doute été de pouvoir compter sur une équipe d’une incroyable solidarité et sur sa motivation indéfectible : tout le monde est resté focalisé sur l’objectif et, pendant neuf mois, a donné le meilleur de lui-même pour l’atteindre. Lorsque nous avons enfin pu célébrer notre succès, l’un des membres de l’équipe a cité cette phrase de Mark Twain pour résumer ce que nous avons accompli : « Ils ne savaient pas que c’était impossible, alors ils l’ont fait. »

[1] ITER : International Thermonuclear Experimental Reactor is an international nuclear fusion research and engineering project.
[2] IFERC : International Fusion Energy Research Centre

Articles connexes

1 Commentaire
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
zelectron

Il ne reste plus qu’à souhaiter que la suite se déroule sans accrocs (comme dans la fameuses série télévisée)