Yan Song | PostDoc
Un nouvel outil créé par des chercheurs de la KAUST contribue à rendre les modèles climatiques plus pratiques à utiliser. Cet outil, appelé générateur stochastique en ligne, réduit l’espace nécessaire au stockage et à l’analyse des données climatiques tout en permettant aux chercheurs de générer des données climatiques quasiment en temps réel, ce qui les aide à comprendre le changement climatique en temps utile.
Les données de réanalyse constituent un élément important de la modélisation du climat. Elles permettent d’intégrer des observations dans les prévisions d’un modèle afin d’en améliorer la précision. Les données de réanalyse peuvent être extrêmement volumineuses et coûteuses à produire, ce qui fait du stockage un problème sérieux. « L’aspect du stockage devient un gros problème pour les centres de recherche sur le climat, car ils effectuent des simulations sur des superordinateurs qui prennent des semaines ou des mois, et ils ont ensuite des téraoctets de données à stocker quelque part pour une utilisation future, ce qui a un coût. Et ils sont réticents à jeter ces données », indique Marc Genton, professeur distingué de statistiques à la KAUST, auteur principal de l’étude.
Pour relever ce défi, les chercheurs peuvent utiliser des outils appelés générateurs stochastiques. Un générateur stochastique représente les données climatiques dans un modèle statistique, qui peut être utilisé pour recréer des données statistiquement similaires. « Si l’on adapte un générateur stochastique aux données, il suffit de stocker les paramètres. Vous pouvez jeter les données et les re-simuler à tout moment, rapidement et à peu de frais », explique M. Genton.
Les générateurs stochastiques permettent également aux chercheurs de régénérer plusieurs ensembles de données climatiques à partir des paramètres stockés. Les modélisateurs climatiques peuvent ainsi mieux comprendre l’incertitude des données et obtenir des prévisions et des conclusions plus précises sur le fonctionnement du climat.
Cependant, les générateurs stochastiques existants présentent quelques lacunes. Ils n’ont pas été développés en tenant compte des contraintes de stockage et ne peuvent pas être mis à jour en direct au fur et à mesure de l’arrivée de nouvelles données. « Étant donné que les données de réanalyse peuvent arriver en temps réel et couvrir un nombre considérable de points temporels, un générateur stochastique pour les données de réanalyse doit relever ces deux défis », ajoute Yan Song, le post-doctorant qui a dirigé l’étude.
Avec un collaborateur de la Lahore University of Management Sciences, Song et Genton ont mis au point un générateur stochastique capable d’intégrer de nouvelles données au fur et à mesure qu’elles arrivent – un générateur stochastique en ligne. Leur article décrivant le nouveau générateur stochastique est l’un des cinq finalistes du prix ADIA Lab Best Paper Award in Climate Data Sciences pour « Pioneering Solutions for a Sustainable Future » (Solutions pionnières pour un avenir durable).
Le générateur peut intégrer des données dans le modèle de manière séquentielle, sous forme de blocs, de sorte que les paramètres du modèle peuvent être mis à jour à mesure que de nouvelles données arrivent. « Notre générateur stochastique en ligne peut émuler des données en temps quasi réel à haute résolution, ce qui le rend adapté aux données de réanalyse », explique M. Song. « Les performances de notre générateur stochastique en ligne sont comparables à celles d’un générateur stochastique développé à partir de l’ensemble des données en une seule fois. »
Le traitement des données par blocs permet également de réduire la charge de calcul des modèles climatiques. Par exemple, lorsque les ressources informatiques disponibles ne sont pas suffisantes pour stocker et analyser un ensemble de données, celui-ci peut être traité comme une séquence de blocs. « Parce qu’il ne traite pas toutes les données en même temps, le modèle que nous avons développé peut traiter des résolutions plus élevées à la fois dans l’espace et dans le temps », commente pour conclure M. Genton.
Le nouveau générateur peut également traiter plusieurs variables au lieu d’une seule. L’équipe l’a utilisé pour analyser deux composantes différentes de la vitesse du vent, mais il pourrait également être adapté à d’autres variables. Certaines variables, comme les précipitations, sont plus compliquées à modéliser et leur intégration dans le générateur stochastique demanderait plus de travail. Les chercheurs prévoient de continuer à développer le générateur pour traiter ces variables.
Légende illustration : Le générateur stochastique en ligne mis au point par les chercheurs de KAUST compresse le stockage des données climatiques et permet de générer des données en temps quasi réel, ce qui accélère la compréhension du changement climatique.
Song, Y., Khalid, Z., & Genton, M.G. « Online stochastic generators using Slepian bases for regional bivariate wind speed ensembles from ERA5. » arXiv: arXiv:2410.08945v1 advance online publication, Oct 2024