Du fait de la transition numérique qu’a connue le secteur de l’énergie au cours des dernières décennies, les modèles basés sur les données complètent avantageusement les approches classiques basées sur la physique. En effet, ces dernières requièrent un niveau élevé de détails qui peut entraîner une charge de calcul trop importante pour certaines analyses telles que les prévisions opérationnelles nécessitant la génération d’ensembles de prévisions via des simulations multiples. Par conséquent, des techniques moins coûteuses en calcul, comme la modélisation basée sur les données, doivent être envisagées.
Les systèmes bas carbone étudiés au CMA sont nombreux et variés. Dans la plupart des cas, des techniques d’apprentissage automatique (ML-Machine Learning en anglais) sont utilisées pour définir une fonction implicite capable d’expliquer la relation entre les données d’intérêt. Pour cela, un modèle est entraîné à l’aide de données historiques. Il s’agit d’un apprentissage supervisé, car le modèle a accès aux données historiques des variables d’entrée, telles que les données météorologiques, climatiques et les consommations d’énergie, ainsi qu’aux variables de sortie comme les données de débit d’eau dans les réservoirs ou la production électrique. Une fois que la fonction est construite, elle peut être utilisée pour effectuer des prévisions (voir Projet Clim2Power).
Récemment, le CMA a étendu son expertise dans le domaine de l’apprentissage par renforcement (RL : Reinforcement Learning en anglais) pour les réseaux intelligents (Smart Grids). C’est le cas du Projet Mérida Smart Energie (MSE). L’apprentissage par renforcement est un problème d’apprentissage en boucle fermée, car les actions de l’apprenant (l’agent) influencent les entrées du modèle. En outre, on ne dit pas à l’agent quelles actions il doit entreprendre, comme dans l’apprentissage supervisé, il doit découvrir les plus gratifiantes en les essayant. Dans le cas des réseaux intelligents, le cadre RL prend la forme suivante : un agent interagit avec l’environnement (par exemple, les éléments d’un réseau intelligent) en prenant une mesure (par exemple, charger/décharger l’énergie de chaque système de stockage d’énergie) en fonction de l’état actuel du système (par exemple, l’état du stockage d’énergie) et des récompenses définies (par exemple, minimiser le coût total de l’énergie). Les résultats affectent la probabilité que le processus passe à un nouvel état.
Les compétences en traitement de données des enseignants-chercheurs du CMA sont génériques et peuvent s’appliquer dans des domaines non directement liés au développement durable. C’est le cas d’un projet qui s’intéresse à l’analyse de données dans le secteur de la santé. Des équipes médicales ont mis en commun des données cliniques autour de maladies rares pour constituer des cohortes de taille significative afin d’élargir leur cadre d’étude. Nous nous intéressons au CMA à l’étude d’une telle cohorte de patients pédiatriques, atteints de mucoviscidose, suivant différents traitements. La réponse aux traitements n’est pas homogène et il n’existe pas encore de marqueur qui fasse consensus. Ce projet, qui participe à la caractérisation des réponses des patients aux thérapies, se fait en relation avec le Centre de référence de la mucoviscidose et affections liées à une anomalie CFTR de l’hôpital Necker-Enfants malades.
Les travaux du CMA concernant l’apprentissage automatique font l’objet de publications dans des revues avec comité de lecture tel que Energy, Energy Strategy Reviews. Clean Technologies et Lecture Notes in Computer Science. La plupart de ces travaux ont également été présentés lors de conférences nationales et internationales, notamment SophIA Summit (2020, 2021, 2022), EURO (2018, 2019), IAEE (2022), BECC (2022), ICAE (2019), PGMO Days 2019, IAEE (2021), LOD (2021) (voir Publications).