Doctorant (H/F) en Informatique Pour La Cosmologie - Paris e, France - CNRS

CNRS
CNRS
Entreprise vérifiée
Paris e, France

il y a 2 semaines

Sophie Dupont

Posté par:

Sophie Dupont

beBee Recruiter


Description
Cette offre est disponible dans les langues suivantes:
Date Limite Candidature : lundi 28 août 2023

**Informations générales**:
**Intitulé de l'offre **:Doctorant (H/F) en informatique pour la cosmologie observationnelle**
Référence : UMR7164-KEVVEL-013
Nombre de Postes : 1
Lieu de travail : PARIS 13
Date de publication : lundi 7 août 2023
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2023
Quotité de travail : Temps complet
Rémunération : 2135,00 € bruts mensuel
Section(s) CN : Interactions, particules, noyaux du laboratoire au cosmos

**Description du sujet de thèse**:

- Titre : Optimisation des pipelines d'analyse bayésienne pour la cosmologie
- Contexte:

- Dans un domaine comme la cosmologie pour lequel les données proviennent d'une expérience qu'il est impossible de refaire, la meilleure manière de pouvoir utiliser les données pour contraindre les modèles physiques consiste à réaliser des simulations numériques les plus réalistes. Ces simulations d'univers sont ensuite comparées aux données des observations en utilisant une approche d'inférence bayésienne, afin de déterminer les paramètres initiaux de l'Univers, avec une incertitude associée.
- C'est le cas par exemple pour l'impact de la matière noire sur le fonds diffus cosmologique, ou bien de l'effet de lentille gravitationnelle faible (weak lensing), phénomène de déviation de la lumière sur son trajet par la présence de matière, mesuré de manière statistique dans les images de galaxies, permettant de contraindre les propriétés de la matière noire ainsi que l'évolution de l'énergie noire dans l'Univers. Simuler le signal du fonds diffus observé par Simons Observatory ou bien des cartes de weak lensing pour analyser les images des sondages à venir LSST et Euclid et inférer les paramètres de la matière noire et de l'énergie noire avec la précision requise par les expériences nécessite d'utiliser des modèles à très haute dimension O(10^10).
- Depuis l'avènement du deep learning et des librairies logicielles associées permettant la différentiation automatique (AD) des fonctions, le genre d'analyse que requiert l'inférence bayésienne basée sur les simulation (SBI) a été grandement simplifiée et portable sur des matériels désormais disponibles comme les GPUs. Cependant la haute dimensionnalité des simulations dont il était question dans une analyse de WL sur des futures données reste difficilement réalisable car elle nécessitait, il y peu, de pouvoir charger les modèles dans la mémoire des GPUs (mémoire fixe et de relativement petite taille).
- Pour faire face à ce manque, Google a développé un framework permettant de faire de l'AD en parallélisant les modèles appelé Mesh-Tensorflow, ce qui a permis à Modi et al de réaliser le premier simulateur cosmologique N-corps entièrement différentiable. Cette distribution des modèles qui est désormais accessible pour les simulations, ne l'est cependant toujours pas pour les langages de programmation probabilistes utilisés pour l'inférence bayésienne à grande échelle.
- Sujet:

- Le sujet de thèse proposé vise à développer et à appliquer un langage de programmation probabiliste écrit en JAX et utilisant la parallélisation SPMD sur GPUs pour mettre à l'échelle les tâches d'inférence bayésienne sur de grands ensembles de données cosmologiques. Ce langage n'a pas d'équivalent sur le marché et sera un atout majeur pour la communauté scientifique. La thèse nécessitera le développement de code CUDA (C++) de bas niveau et sera menée de manière collaborative en suivant la philosophie de l'open source. Le langage sera appliqué à des données du fonds diffus cosmologique des expériences CMB-S4/Simons Observatory ainsi que des images de galaxies provenant de Rubin/LSST. Ce projet ambitieux nécessite de solides compétences en développement informatique et une compréhension de l'apprentissage automatique, offrant des ressources précieuses à la communauté de recherche et à l'industrie.
- Calendrier prévisionnel:

- 1ère année- exploration du formalisme bayésien des pixels à la cosmologie dans le cadre des analyses CMB et des relevés optiques grands champs et aux vraisemblances clés comprises dans le cadre du projet SciPol
- identification de frameworks d'accélération matériels et logiciels accessibles et adaptés à la résolution des problèmes d'analyse bayésienne
- dimensionnement des problèmes, proposition et implémentation d'une méthode pour évaluer les performances des différents frameworks
- comparaison et sélection de frameworks performants et adaptés à la résolution du problème SciPol pour l'analyse des données du Simons Observatory (SO) et du relevé Rubin/LSST

2ème année- validation et exploitation des méthodes sur simulations réalistes et sur les premières données SO et Rubin/LSST

3èm

Plus d'emplois de CNRS