Emplois
>
Paris

    Doctorant informatique/ machine learning: Foundation Models for Physics-Aware Deep Learning - Paris, France - CNRS

    CNRS
    CNRS Paris, France

    il y a 2 semaines

    Cnrs background
    CDD
    Description

    Informations générales

    Intitulé de l'offre : Doctorant informatique/ machine learning: Foundation Models for Physics-Aware Deep Learning (H/F)
    Référence : UMR7222-PATGAL-001
    Nombre de Postes : 1
    Lieu de travail : PARIS 05
    Date de publication : vendredi 17 mai 2024
    Type de contrat : CDD Doctorant/Contrat doctoral
    Durée du contrat : 36 mois
    Date de début de la thèse : 1 novembre 2024
    Quotité de travail : Temps complet
    Rémunération : La rémunération est d'un minimum de 2100,00 € brut mensuel
    Section(s) CN : Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues

    Description du sujet de thèse

    CONTEXTE

    Le « physics-aware Deep Learning » est un domaine de recherche émergent visant à étudier le potentiel des méthodes d'IA pour développer la recherche pour la modélisation de phénomènes naturels complexes. Il s'agit d'un sujet de recherche à fort enjeux qui a le potentiel de changer la manière dont nous abordons la recherche dans toute une gamme de domaines scientifiques. Un domaine où cette idée suscite de grands espoirs est la modélisation de la dynamique complexe caractérisant les phénomènes naturels se produisant dans des domaines aussi divers que les sciences du climat, les sciences de la Terre, la biologie, la dynamique des fluides. Diverses approches sont en cours de développement : des méthodes d'apprentissage, des méthodes qui exploitent les connaissances a priori des principes physique couplées à l'apprentissage automatique, des solveurs neuronaux qui résolvent directement les équations différentielles. Malgré des progrès significatifs, il s'agit d'un sujet émergent avec de nombreux problèmes ouverts en apprentissage automatique. Parmi toutes les directions de recherche exploratoires, l'idée de développer des modèles de fondation émerge comme l'un des défis fondamentaux de ce domaine. Cette proposition de thèse vise à explorer différents aspects de ce sujet.

    DIRECTIONS DE RECHERCHE

    Les modèles de fondation sont l'état de l'art dans des domaines tels que le traitement du langage naturel (GPT, Llama, Mistral, ou la vision (CLIP, DALL-E, Flamingo, . Entraînés avec de grandes quantités de données par auto-supervision, ils peuvent être utilisés ou adaptés à des tâches cibles tout en bénéficiant d'un pré-entraînement. Les premières tentatives pour appliquer cette idée dans des domaines scientifiques sont actuellement en cours d'investigation dans des domaines aussi divers que la biologie (Jumper et al. 2021), les molécules (Zhou 2023), la prévision météorologique (Pathak 2022, Nguyen 2023, Kochkov Le paradigme des modèles de fondation est-il adaptable à la modélisation physique de systèmes dynamiques ? Certains travaux exploratoires sont actuellement en cours (McCabe 2023, Subramanian 2023, Hao Ils suggèrent que l'apprentissage à partir de plusieurs équations différentielles partielles (EDP) améliore les performances de prédiction sur des équations spécifiques. L'objectif de la thèse est d'explorer différentes voies de recherche sur ce sujet pour la modélisation de systèmes dynamiques.

    RÉSOLUTION DES EDP PARAMÉTRIQUES

    Une première étape consiste à considérer la résolution d'équations aux dérivées partielles (EDP) paramétriques, c'est-à-dire d'EDP d'une même famille avec des paramètres variables incluant des conditions initiales et aux limites, des fonctions de forçage ou des coefficients. Il est fréquent que différentes valeurs de paramètres donnent lieu à des dynamiques très différentes. Les solveurs neuronaux actuels fonctionnent soit sur des conditions fixes, soit sur une petite gamme de paramètres. Une première exploration consistera à analyser le potentiel de solveurs neuronaux représentatifs pour interpoler et pour extrapoler hors de la distribution d'apprentissage. Un problème clé est le développement de techniques d'apprentissage permettant une adaptation rapide à de nouvelles dynamiques. Nous examinerons des méthodes inspirées du meta-learning pour développer des stratégies adaptatives (Yin 2021, Kirchmeyer 2022).

    MODELISER DES PHYSIQUES MULTIPLES

    L'apprentissage de modèles de fondation est particulièrement intéressante dans le cas où les données sont rares, les caractéristiques physiques pouvant être apprises à partir de dynamiques apparentées, disponibles en grande quantité, puis transférées au problème cible. Apprendre à partir de plusieurs dynamiques pose des défis algorithmiques car elles opèrent sur des domaines différents, avec des résolutions spatiales et temporelles différentes. Nous considérerons un cadre Encode-Process-Decode permettant de modéliser les lois d'évolution dans un espace latent. En ce qui concerne la variabilité temporelle des observations, nous envisagerons des modèles pouvant fonctionner sur des séries irrégulières dans l'esprit de (Yin Ce cadre sera évalué avec un sélection d'architectures neuronales.

    GÉNÉRALISATION A DE NOUVELLES DYNAMIQUES

    La généralisation à de nouvelles dynamiques est un problème central motivant le développement de modèles de fondation en science. Il s'agit d'une question clé pour l'adoption de méthodes d'apprentissage en physique et plus généralement dans tout contexte où les données sont rares. Nous considérerons le cadre général de l'apprentissage « few shots » visant à spécialiser des modèles pré-entraînés pour des tâches cibles. Dans ce contexte, l'objectif sera de développer des algorithmes pour l'adaptation rapide des modèles de fondation à ces tâches. Différentes stratégies seront analysées et développées, comme l'échantillonnage de paramètres, le meta-learning pour l'adaptation (Yin 2023) et des stratégies inspirées des développements en langage naturel comme l'apprentissage en contexte (Chen 2024).

    REFERENCES

    Chen, W., Song, J., Ren, P., Subramanian, S., Morozov, D., & Mahoney, M. W Data-Efficient Operator Learning via Unsupervised Pretraining and In-Context Learning. 1–21. http:///abs/
    Hao, Z., Su, C., Liu, S., Berner, J., Ying, C., Su, H., Anandkumar, A., Song, J., & Zhu, J DPOT: Auto-Regressive Denoising Operator Transformer for Large-Scale PDE Pre-Training. Icml. http:///abs/
    Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., Tunyasuvunakool, K., Bates, R., ˇZ ́ıdek, A., Potapenko, A., et al. Highly accurate protein structure prediction with alphafold. Nature, :583–589, 2021.
    Kirchmeyer, M., Yin, Y., Donà, J., Baskiotis, N., Rakotomamonjy, A., & Gallinari, P Generalizing to New Physical Systems via Context-Informed Dynamics Model. ICML.
    Kochkov D, Yuval J, Langmore I, et al. Neural General Circulation Models. In: ArXiv: v2. ; 2024.
    McCabe, M., Blancard, B. R.-S., Parker, L. H., Ohana, R., Cranmer, M., Bietti, A., Eickenberg, M., Golkar, S., Krawezik, G., Lanusse, F., Pettee, M., Tesileanu, T., Cho, K., & Ho, S Multiple Physics Pretraining for Physical Surrogate Models. 1–25 http:///abs/
    Nguyen, T., Brandstetter, J., Kapoor, A., Gupta, J. K., and Grover, A. Climax: A foundation model for weather and climate. arXiv: , 2023.
    Pathak, J., Subramanian, S., Harrington, P., Raja, S., Chattopadhyay, A., Mardani, M., Kurth, T., Hall, D., Li, Z., Azizzadenesheli, K., et al. Fourcastnet: A global data-driven high-resolution weather model using adaptive fourier neural operators.
    Subramanian, S., Harrington, P., Keutzer, K., Bhimji, W., Morozov, D., Mahoney, M., & Gholami, A Towards Foundation Models for Scientific Machine Learning: Characterizing Scaling and Transfer Behavior. NeurIPS. http:///abs/
    Yin, Y., Ayed, I., de Bézenac, E., Baskiotis, N. and Gallinari, P LEADS: Learning Dynamical Systems that Generalize Across Environments. Neurips.
    Yin, Y., Kirchmeyer, M., Franceschi, J.-Y., Rakotomamonjy, A., & Gallinari, P Continuous PDE Dynamics Forecasting with Implicit Neural Representations. ICLR.
    Zhou, G., Gao, Z., Ding, Q., Zheng, H., Xu, H., Wei, Z., Zhang, L., and Ke, G. Uni-mol: a universal 3d molecular representation learning framework. 2023

    Contexte de travail

    La bourse de doctorat est un poste de trois ans débutant en octobre/novembre 2024. Il ne comprend pas d'obligation d'enseignement, mais il est possible d'enseigner. Le doctorant travaillera à Sorbonne Université (, sur le campus Pierre et Marie Curie au centre de Paris. Il/Elle intégrera l'équipe MLIA (Apprentissage Automatique et Apprentissage Profond pour l'Accès à l'Information) à l'ISIR (Institut des Systèmes Intelligents et de Robotique). MLIA collabore avec des scientifiques d'autres disciplines telles que le climat ou la mécanique des fluides. Le doctorant sera encouragé à s'impliquer dans de telles collaborations.

    Contraintes et risques

    NON


  • Data Recrutement

    Deep Learning Engineer

    il y a 4 jours


    Data Recrutement Paris, France

    Offre publiée le Paris · - Fonction Data scientist ml ia nlp dl · - Taille entreprise de 11 à 20 · - Télétravail partiel · - Technologies Python · - Technologies Tensorflow · - Expérience 3 à 5 ans · - Expérience 6 à 10 ans · - Expérience Plus de 10 ans · - Statut CDI · - Min 60k ...


  • BI SOLUTIONS Paris, France

    Expert Machine Learning Deep learning ( possibilité temps partiel) · Mise en place d'une plateforme de Machine Learning production ready · Aide à la décision sur les chaines de production · Aide à la décision stratégique du client · Identification de défauts pour réduire les déch ...


  • AUDENSIEL TECHNOLOGIES Boulogne-Billancourt, France

    Détection d'un nouvel appareil dans un résidentiel à partir de la charge · électrique totale · Encadrant E-mail Mode d'évaluation · Contexte et description · La surveillance non intrusive de la charge électrique dans un résidentiel (NILM) fait référence au problème de la désagrég ...

  • AXA

    Data Analyst en Deep Learning

    il y a 2 semaines


    AXA Nanterre, France

    Référence de l'offre · Type de contrat · CDD · Niveau d'expérience · Jeunes diplômés · Société du groupeAXA France · Famille métierData Science · Localisation · NANTERRE CEDEX, Hauts-de-Seine · **Votre rôle et vos missions**: · Vous êtes passionné/passionnée de data et deep learn ...


  • RTE - Le Réseau de Transport d'Electricité Paris, France

    **Description de l'offre**: · Lieu : à Paris La Défense · Durée et/ou période du stage : De janvier / Septembre 2024 · En tant que stagiaire, vous serez intégré(e) au sein du Département développement logiciel (100 personnes) ET participerez aux projets concernant l'acquisition, ...

  • Stereolabs

    Ingénieur Deep Learning

    il y a 1 jour


    Stereolabs PARIS, France

    Vos missions : · - Suivre l'état de l'art, implémenter de nouvelles architectures et entraîner des réseaux AGI de perception, reconstruction 3D et de compréhension sémantique simultanée de l'environnement. · - Créer et analyser les données nécessaires à l'entraînement et l'évalua ...


  • Mister Bin Paris e, France

    **Résumé poste**: · - Tu nous aideras sur toutes les tâches liées à l'intelligence artificielle (collection et maintenance des images, amélioration IA, architecture AWS), sur notre BDD d'information de tri et de recyclage, de la data analyse, de la progra pour notre machine Binko ...


  • Kicklox Saint-Cloud, France

    **L'offre**: · **Secteurs** · Automobile, Aéronautique, Spatial, Ferroviaire, Télécommunications, Energie, Services & Systèmes d'Informations, Naval, Machines & Industrie Lourde · **Modalités** · - Date de démarrage : dès que possible · - Candidats recherchés : 1 · - Expérience : ...


  • deepomatic Paris e, France StageSHIP

    **Internship : Leveraging Large **Multimodal** Transformer Models for Deepomatic Applications** · Deepomatic works with companies who install or maintain equipments on the field. We develop an AI platform which allows our clients to automatically control the quality and complianc ...


  • BNP Paribas Paris, France À temps plein

    Auquotidien, ça donne quoi · Vous serez un des référents en matière d'apprentissage profond et par renforcement. · Vous accompagnerez les entités opérationnelles dans la réalisation de leurs projets de NLP et d'IDP. · Vous développerez des composants d'IA basés sur l'analyse d ...


  • BNP Paribas Paris, France permanent

    Auquotidien, ça donne quoi · Vous serez un des référents en matière d'apprentissage profond et par renforcement. · Vous accompagnerez les entités opérationnelles dans la réalisation de leurs projets de NLP et d'IDP. · Vous développerez des composants d'IA basés ...


  • Aquyre Biosciences/ LLTECH Paris e, France

    **Overview of Aquyre Bioscience**: · At Aquyre Biosciences Inc. (Cambridge, MA) our mission is to become the standard of care for tissue adequacy assessment. Tissue and biopsy assessment is critical for the proceduralists doing the biopsies, for the patients who need immediate in ...


  • Aquyre Biosciences/ LLTECH Paris e, France

    **Overview of Aquyre Bioscience**: · At Aquyre Biosciences Inc. (Cambridge, MA) our mission is to become the standard of care for tissue adequacy assessment. Tissue and biopsy assessment is critical for the proceduralists doing the biopsies, for the patients who need immediate in ...


  • Artefact Paris, France

    Présentation d'Artefact · Artefact est une société française spécialisée dans le déploiement de technologies d'IA et de solutions data dont la mission est d'accélérer l'adoption des données et de l'IA afin d'avoir un impact positif sur les individus et les organisations. · Spéci ...

  • AXA Group

    Data Analyst en Deep Learning

    il y a 2 semaines


    AXA Group Nanterre, France À temps plein

    Vous êtes passionné/passionnée de data et deep learning et êtes disponible prochainement ? · Cette annonce va surement retenir votre attention · ************** · Nous recherchons une ou un Data Analyst (F/H) passionné par l'innovation et le deep learning pour un projet stratég ...


  • BNP Paribas PARIS ER ARRONDISSEMENT, France

    Au quotidien, ça donne quoi · Vous serez un des référents en matière d'apprentissage profond et par renforcement. · Vous accompagnerez les entités opérationnelles dans la réalisation de leurs projets de NLP et d'IDP. · Vous développerez des composants d'IA basés sur l'analyse d ...


  • Jobs for Humanity Paris, France

    Company Description · Jobs for Humanity is dedicated to building an inclusive and just employment ecosystem. Therefore, we have dedicated this job posting to individuals coming from the following communities: Refugee, Neurodivergent, Single Parent, Blind or Low Vision, Deaf of Ha ...


  • Netatmo Boulogne-Billancourt, France StageSHIP

    **Company Description** · At Netatmo, we are all about the Smart Home Our mission is to design products that make your home safer, more comfortable and ultimately more eco-friendly. Since November 2018, Netatmo has become a part of the Legrand group - a global leader in electrica ...


  • Maud LECOMTE Versailles, France

    **Deep Learning for the next generation of cellular vehicular communications systems (6G-V2X)**: · - Réf · - **ABG-116161** · - Sujet de Thèse- 05/08/2023- Contrat doctoral- Maud LECOMTE- Lieu de travail- VERSAILLES - Ile-de-France - France- Intitulé du sujet- Deep Learning for t ...


  • DGSE - Direction Générale de la Sécurité Extérieure Paris, France

    La Direction Générale de la Sécurité Extérieure, DGSE, recrute un(e) Ingénieur(e) en IA Deep Learning traitement de médias (H/F). · Le poste est situé à Paris. La nationalité française est obligatoire. · Domaine métier · Sciences et Technologies · Votre environnement de travail ...