Alors que Philadelphie s’efforce d’atteindre les objectifs en matière d’émissions de gaz à effet de serre définis dans son plan 2050, des chercheurs du College of Engineering de l’université Drexel se tournent vers un modèle d’apprentissage automatique pour comprendre le rôle du zonage dans la régulation de la consommation d’énergie des bâtiments.
Cette initiative pourrait s’avérer cruciale pour aider la ville à atteindre ses objectifs environnementaux ambitieux.
En 2017, Philadelphie s’est engagée à atteindre la neutralité carbone d’ici 2050, en mettant principalement l’accent sur la réduction des émissions liées à la consommation d’énergie des bâtiments, qui représentaient près de 75 % de l’empreinte carbone de la ville. Pour atteindre cet objectif, il est essentiel non seulement de mettre en œuvre des pratiques énergétiques durables pour les bâtiments existants, mais aussi d’intégrer des projections de consommation d’énergie dans les décisions de zonage qui façonnent le développement futur.
Philadelphie, l’une des plus anciennes villes d’Amérique, est confrontée à des défis uniques en raison de la diversité des types de bâtiments et de la consommation d’énergie correspondante. Par conséquent, une approche unique n’est pas adaptée à la planification à l’échelle de la ville. Simi Hoque, professeur au College of Engineering, souligne l’importance d’adapter les programmes énergétiques aux différents quartiers plutôt que d’adopter des politiques générales.
L’équipe de M. Hoque est convaincue que l’apprentissage automatique peut fournir des informations précieuses sur l’impact potentiel des décisions de zonage sur les futures émissions de gaz à effet de serre des bâtiments. Ils affirment que les modèles d’apprentissage automatique existants peuvent traiter efficacement des ensembles de données volumineux, incohérents et incomplets sur la consommation d’énergie.
Pour extraire des informations significatives de ces données disparates, les chercheurs ont mis au point une méthodologie utilisant deux programmes d’apprentissage automatique. Le premier identifie des modèles dans de vastes ensembles de données et génère des projections sur l’utilisation future de l’énergie, tandis que le second discerne les facteurs les plus susceptibles d’influencer ces projections. Cette approche innovante pourrait être la clé de l’avenir durable de Philadelphie.
Ils ont d’abord entraîné un programme d’apprentissage profond, appelé Extreme Gradient Boosting (XGBoost), avec des volumes de données sur l’utilisation de l’énergie commerciale et résidentielle à Philadelphie provenant de l’enquête sur la consommation d’énergie résidentielle et de l’enquête sur la consommation d’énergie des bâtiments commerciaux de l’U.S. Energy Information pour 2015, ainsi que des données démographiques et socio-économiques de la ville provenant de l’American Communities Survey du U.S. Census Bureau pour la même période.
Le programme a suffisamment appris des données pour pouvoir établir des corrélations entre une longue liste de variables, telles que la densité des bâtiments, la population d’une zone donnée, la superficie des bâtiments, le nombre d’occupants, le nombre de jours d’utilisation du chauffage ou de la climatisation et la consommation d’énergie pour chaque maison ou bâtiment.
Si les modèles d’apprentissage profond comme XGBoost sont très utiles pour faire des prévisions éclairées, compte tenu d’un ensemble de données vaste et incohérent, leurs méthodes peuvent être obscurcies par la complexité des opérations qu’ils effectuent. Mais pour que le programme devienne un outil utile pour guider les planificateurs, l’équipe devait décortiquer la « boîte noire » suffisamment pour transformer ses projections en recommandations.
Pour ce faire, elle a eu recours à une analyse d’explications additives de Shapley, une évaluation utilisée dans la théorie des jeux pour répartir le mérite entre les facteurs qui ont contribué à un résultat. Cela leur a permis de déterminer dans quelle mesure une modification de la densité des bâtiments ou de la superficie en pieds carrés, par exemple, a joué un rôle dans les projections du programme.
« Les modèles d’apprentissage automatique tels que XGBoost apprennent à parcourir des ensembles de données pour accomplir une tâche spécifique – comme générer une prévision fiable d’un système – mais ils ne prétendent pas vraiment comprendre ou représenter les relations sur le terrain qui sous-tendent un phénomène« , a déclaré M. Hoque. « Et bien qu’une analyse de Shapley ne puisse pas nous dire quelles caractéristiques ont le plus grand impact sur la consommation d’énergie, elle peut expliquer quelles caractéristiques ont eu le plus grand impact sur la prédiction de la consommation d’énergie du modèle, ce qui est une information très utile.«
L’équipe a ensuite mis le modèle à l’épreuve en fournissant des données d’entrée provenant d’un scénario hypothétique proposé par la Commission de planification régionale de la vallée du Delaware, qui estimait que le développement économique de Philadelphie se poursuivrait jusqu’en 2045. Le scénario suggère une augmentation de 17 % de la population, avec une augmentation proportionnelle des ménages, et présente un certain nombre de possibilités différentes pour l’emploi et le revenu par région dans toute la ville.
Pour chaque scénario, le modèle a projeté comment les nouveaux développements résidentiels et commerciaux modifieraient les émissions de gaz à effet de serre provenant de la consommation d’énergie des bâtiments dans 11 parties différentes de la ville et quelles variables jouaient un rôle prépondérant dans l’établissement des projections.
Si l’on considère plus particulièrement l’utilisation de l’énergie dans le secteur résidentiel pour le scénario 2045, le programme suggère que six des onze zones diminueraient leur consommation d’énergie – principalement les régions à faibles revenus. En revanche, les régions à revenus mixtes, comme la partie la plus septentrionale de la ville, y compris Oak Lane, connaîtraient probablement une augmentation de leur consommation d’énergie.
Selon l’analyse de Shapley, la présence d’habitations unifamiliales attenantes (consommation d’énergie plus faible) par rapport aux habitations individuelles (consommation d’énergie plus élevée) a joué un rôle important dans les projections, les coûts mensuels élevés de l’électricité, les terrains de moins d’un acre et le nombre plus faible de pièces par bâtiment contribuant tous à des projections de consommation d’énergie plus faibles.
« Dans l’ensemble, le modèle de prévision de l’énergie résidentielle montre que les caractéristiques liées à une intensité de construction plus faible sont liées à des estimations de consommation d’énergie plus faibles dans le modèle, par exemple une superficie de terrain plus faible, un nombre de pièces plus faible par unité« , écrivent-ils. « Ces résultats justifient de réexaminer les effets des politiques de zonage, couramment présentées comme une solution de logement abordable à Philadelphie et dans d’autres villes des États-Unis, et les changements subséquents dans l’utilisation de l’énergie pour ces zones.«
En ce qui concerne le volet commercial du scénario, le modèle d’apprentissage automatique n’a pas prévu beaucoup de changements dans la consommation d’énergie dans les conditions de 2045 – la consommation d’énergie pour les plus grands bâtiments commerciaux est restée élevée. Et bien qu’elle ait été limitée à l’examen de six variables – la superficie, le nombre d’employés, le nombre d’étages, les degrés-jours de chauffage, les degrés-jours de refroidissement et l’activité principale du bâtiment – en raison des données disponibles dans l’ensemble d’apprentissage, l’analyse de Shapley a indiqué que la superficie et le nombre d’employés étaient les prédicteurs les plus importants de la consommation d’énergie pour la plupart des types d’immeubles commerciaux.
« En ce qui concerne le secteur commercial, l’étude suggère que les bâtiments commerciaux situés dans les quantiles supérieurs de la superficie et du nombre d’employés devraient être les cibles principales des programmes de réduction de la consommation d’énergie« , écrivent les auteurs. « La recherche postule un seuil approximatif de 10 000 pieds carrés de surface totale de bâtiment, les bâtiments dépassant ce seuil étant prioritaires en raison de leur influence disproportionnée sur les prévisions énergétiques du modèle.«
Bien que les chercheurs mettent en garde contre l’hypothèse d’un lien direct entre les variables et les changements de consommation d’énergie dans le modèle, ils suggèrent qu’il reste très utile en raison de sa capacité à donner aux planificateurs un aperçu à la fois de haut niveau et granulaire de l’interaction entre les décisions de zonage et de développement et de leur effet sur la consommation d’énergie.
Je vois un grand potentiel dans l’utilisation de modèles d’apprentissage automatique comme XGBoost pour prévoir les augmentations ou les diminutions de la consommation d’énergie dues à de nouveaux projets de construction ou à des changements de politique », a déclaré M. Hoque. « Par exemple, la construction d’une nouvelle ligne de chemin de fer dans un quartier peut modifier la démographie et l’emploi dans ce quartier, et nos méthodes seraient idéales pour intégrer ces informations dans le contexte d’un modèle de prévision de la consommation d’énergie.«
L’équipe reconnaît que d’autres tests sont nécessaires et que le programme ne s’améliorera qu’au fur et à mesure qu’il recevra des données supplémentaires. Ils suggèrent que la prochaine étape de la recherche consisterait à se concentrer sur les zones de la ville où l’on sait que la consommation d’énergie est élevée et à effectuer une analyse Shapely pour discerner certains des facteurs qui pourraient y contribuer.
« Nous espérons que cette étude constituera une ressource pour les futurs chercheurs et décideurs politiques, afin qu’ils n’aient pas à parcourir l’ensemble de la ville de Philadelphie, mais qu’ils puissent se concentrer sur les quartiers et les variables que nous avons identifiés comme des zones potentiellement importantes« , a déclaré M. Hoque. « Idéalement, les études futures utiliseraient des méthodes plus faciles à interpréter pour vérifier si ces caractéristiques correspondent réellement à des estimations énergétiques plus ou moins élevées dans une zone donnée.«