Il y a quelques années, pour démontrer la puissance d’une technologie relativement simple, le géant du logiciel Oracle a construit une grappe de 1 050 ordinateurs Raspberry Pi 3iPB+. Aujourd’hui, la grande grappe d’Oracle, le plus grand assemblage de ce type jamais construit, a trouvé un nouveau foyer à l’université de Santa Barbara (UCSB).
Les professeurs d’informatique Chandra Krintz et Rich Wolski ont reçu la grappe en don de la part d’Oracle, qui l’avait retirée des salons informatiques. La deuxième plus grande grappe de Raspberry Pi a été construite au laboratoire national de Los Alamos et est deux fois plus petite.
« Le Raspberry Pi a été conçu pour fonctionner avec l’internet des objets (IoT) », explique M. Wolski, titulaire de la Duval Family Presidential Chair in Energy Efficiency, « Il est utilisé pour l’expérimentation et le déploiement de systèmes relativement basiques ». Les appareils sont simples et peu coûteux, ils fonctionnent avec une faible quantité d’énergie mais peuvent être programmés à l’aide d’un vaste écosystème de logiciels libres et sont également compatibles avec une grande variété de dispositifs matériels et de capteurs.
Ces machines de la taille d’une carte de crédit, peu coûteuses et de faible puissance, sont largement utilisées, normalement en tant qu’unités individuelles ou dans un petit groupe de plusieurs unités, pour explorer, apprendre et enseigner l’informatique et la programmation, et pour effectuer certains types de tâches informatiques liées à la recherche.
« Il s’agit d’un appareil intéressant, mais dont les performances sont médiocres », a t-il ajouté. « Oracle a décidé de faire une expérience en construisant une grande collection de ces appareils dans un petit boîtier. L’entreprise expédiait ensuite l’ensemble à des salons professionnels pour montrer à quel point elle était capable de concevoir un système de très grande taille, à très faible consommation d’énergie et à très faible technologie pour faire fonctionner son logiciel. »
Connu pour ses avancées technologiques, en particulier à l’échelle de l’entreprise et dans le nuage, Oracle voulait montrer qu’il pouvait aussi faire de très petites choses, et ce de manière très efficace.
« Finalement, ils sont passés à des choses plus grandes et meilleures, et (l’assemblage du Raspberry Pi) est resté dans sa caisse dans un entrepôt », a indiqué M. Wolski. « Un jour, le directeur d’Oracle Research est venu visiter notre laboratoire – parce que l’un de nos étudiants diplômés faisait un stage chez Oracle – et il a vu que nous avions un petit ensemble de Raspberry Pis dans notre laboratoire, que nous utilisons dans nos recherches et comme outil d’enseignement. Il a jeté un coup d’œil à notre petite collection et nous a dit : Avez-vous besoin de plus de Raspberry Pis ? »
Si vous êtes un universitaire et que quelqu’un vous demande « Puis-je vous donner quelque chose ? », la réponse est toujours « Oui, absolument, sans hésiter » », a déclaré M. Wolski en riant. « C’est alors que cette énorme grappe est arrivée à l’UCSB. »
Le cluster a été conçu par Chris Benson, ancien ingénieur d’Oracle, qui travaille aujourd’hui au Lawrence Livermore National Laboratory. Benson est intervenu pour aider Krintz et Wolski à mettre en place le système. « Il a été d’une aide précieuse », a déclaré pour sa part M. Krintz. « Il est venu plusieurs fois sur le campus pour nous guider et nous conseiller sur le système. Il s’est avéré que beaucoup de choses qu’Oracle faisait dépendaient de l’accès aux ingénieurs d’Oracle en interne. Nous sommes donc en train de remanier la machine pour la rendre utilisable dans un environnement institutionnel public, avec des logiciels libres pour permettre un large accès aux étudiants et à d’autres personnes.
« Chris a assemblé la technologie d’une manière qui n’avait jamais été faite auparavant », a t-il ajouté. « Elle arrivait en fin de vie et peut désormais continuer à servir la recherche et l’enseignement de l’informatique à l’UCSB. »
Comme il ne devait fonctionner que quelques heures lors d’un salon professionnel, le cluster a été construit différemment que s’il avait été destiné à la recherche doctorale. « Au cours des huit derniers mois, nous avons appris ce qu’il fallait faire pour transformer cette expérience très intéressante en un élément durable de l’infrastructure de recherche », a précisé encore M. Wolski.
La taille de la grappe Raspberry Pi a posé quelques problèmes, notamment en termes de refroidissement. « Nous ne disposions pas d’une climatisation suffisante pour quelque chose d’aussi grand dans Henley Hall, le bâtiment LEED Platine qui abrite l’Institut pour l’efficacité énergétique de l’UCSB et qui est principalement refroidi par l’air naturel », a t-il ajouté. « Nous pensions initialement recevoir 10 ou 20 Raspberry Pis, 50 au maximum. Mais nous en avons reçu 1 050 ! »
« Le matériel fonctionne à basse tension et a donc une empreinte thermique relativement faible, mais lorsque plus de 1 000 unités sont regroupées aussi étroitement que celles-ci, ce qu’Oracle a fait pour rendre la grappe aussi petite que possible, la chaleur peut s’accumuler », des ajustements ont dû être faits pour adapter le système de refroidissement dans Henley Hall.
« Oracle a construit cette grappe Raspberry Pi pour démontrer sa capacité à utiliser une technologie relativement simple pour faire fonctionner ses logiciels très complexes, ce qui montre à quel point nous avons de la chance d’avoir cette même grappe – la plus grande au monde – à l’UCSB », a déclaré John Bowers, titulaire de la chaire Fred Kavli de nanotechnologie, professeur émérite de génie électrique et informatique et de matériaux, et directeur de l’Institute for Energy Efficiency (IEE), où la grappe Raspberry Pi est hébergée. « J’ai hâte de voir ce que Chandra et Rich vont en faire, tant sur le plan de la recherche qu’en ce qui concerne l’énorme opportunité qu’il offre aux étudiants d’étudier l’Internet des objets à une échelle inégalée dans peut-être n’importe quelle autre université. »
Depuis la modernisation du système de climatisation du Henley Hall, Krintz et Wolski ont également mis au point des mesures de protection contre la surchauffe. Si la température de la pièce commence à augmenter, les courriels et les messages textuels s’éteignent. « Nous utilisons notre propre système de recherche sur l’internet des objets pour surveiller le système, qui n’a jamais été conçu pour fonctionner sans surveillance 24 heures sur 24 et 7 jours sur 7. C’est un grand défi et une excellente occasion de recherche et d’apprentissage », a commenté M. Wolski.
« Aujourd’hui, dans le cadre de nos efforts de recherche, nous essayons de comprendre ce que signifie la création d’un centre de données à longue durée de vie et à faible consommation d’énergie », a affirmé M. Krintz. « Par exemple, nous développons de nouvelles techniques de programmation intelligentes qui placent les tâches dans le système en fonction d’un bilan thermique. Le système doit également s’adapter aux changements de niveau de tension résultant de la charge des unités de distribution d’énergie. Nos avancées tiendront compte automatiquement de ces changements afin de maintenir le système froid et équilibré en ce qui concerne la consommation d’énergie. »

La résolution des problèmes liés au cluster s’inscrit parfaitement dans la mission du RACELab (The Lab for Research on Adaptive Computing Environments) dirigé par Krintz et Wolski, qui se consacre à l’étude de l’IdO d’un point de vue systémique. « L’internet des objets nécessite de disposer d’une infrastructure informatique dans des endroits insolites, tels que le placard de votre maison ou l’arrière-salle d’un Starbucks, de sorte qu’elle devra être peu gourmande en énergie et facile à utiliser – pour préparer votre café, par exemple », a fait remarquer M. Krintz. « C’est le point essentiel. »
« Aujourd’hui, dans le cadre de nos efforts de recherche, nous déterminons ce que signifie la création d’un centre de données à longue durée de vie et à faible consommation d’énergie », a ajouté M. Krintz. « Par exemple, nous développons de nouvelles techniques de planification intelligentes qui placent les tâches dans le système en fonction d’un bilan thermique. Le système doit également s’adapter aux changements de niveau de tension résultant de la charge des unités de distribution d’énergie. Nos avancées tiendront compte de ces changements automatiquement afin de maintenir le système froid et équilibré en ce qui concerne la consommation d’énergie. »
La résolution des problèmes liés au cluster s’inscrit parfaitement dans la mission du RACELab (The Lab for Research on Adaptive Computing Environments) dirigé par Krintz et Wolski, qui se consacre à l’étude de l’IdO d’un point de vue systémique. « L’internet des objets nécessite de disposer d’une infrastructure informatique dans des endroits insolites, tels que le placard de votre maison ou l’arrière-salle d’un Starbucks, de sorte qu’elle devra être peu gourmande en énergie et facile à utiliser – pour préparer votre café, par exemple », a fait remarquer M. Krintz. « C’est le point essentiel. »
Les étudiants du laboratoire travaillent d’arrache-pied pour adapter le système, que l’on appelle désormais affectueusement « Godzilla Pi ». (Ils construisent des visualisations en 3D pour la réalité augmentée, afin que nous puissions zoomer et dire : « Que fait ce Pi, et quand ? » a dit M. Wolski. Nous aimerions pouvoir cliquer ou zoomer sur le Pi pour qu’il me dise : « Je suis malade. Voici ma fréquence d’horloge. C’est ce que je suis en train de faire. C’est la dernière fois que j’étais en bonne santé », car nous avons besoin d’une sorte de rapport de santé et d’état à l’échelle. Nous voulons être en mesure d’examiner n’importe quelle partie de l’architecture 3D et d’identifier instantanément tout problème ».
« Dans notre laboratoire, nous construisons le logiciel du système, nous étudions de nouveaux types de systèmes pour gérer les déploiements IoT, et nous sommes très intéressés par la façon dont nous passons de très petits appareils – même plus petits que les Raspberry Pis – à de très grands appareils comme le nuage », a affirmé M. Wolski. « Beaucoup de nos étudiants utilisent cette grappe comme machine à grande échelle pour simuler de nombreuses petites machines fonctionnant ensemble. Nous l’utilisons également comme banc d’essai pour les choses que nous allons déployer dans la nature ».
La puissance de calcul en réseau de la grappe géante de Raspberry Pi permet à leur laboratoire d’étudier ces questions de puissance et de chaleur pour l’internet des objets à une plus grande échelle que n’importe qui d’autre dans le monde, offrant aux étudiants une expérience qui, à bien des égards, est unique parmi les universités. « C’est assez remarquable », a conclu M. Wolski. « Oracle nous a offert, ainsi qu’à la communauté des chercheurs en informatique de l’UCSB, une opportunité rare et précieuse. »