Grands Modèles de Langage Pour La Conception de - Versailles, France - Université Paris-Saclay GS Informatique et sciences du numérique

Sophie Dupont

Posté par:

Sophie Dupont

beBee Recruiter


Description
**Grands Modèles de Langage pour la Conception de Matériaux // Large Language Models for Material Design**:

- Réf **ABG-121162**
**ADUM-54730**
- Sujet de Thèse- 13/03/2024- Université Paris-Saclay GS Informatique et sciences du numérique- Lieu de travail- Versailles cedex - France- Intitulé du sujet- Grands Modèles de Langage pour la Conception de Matériaux // Large Language Models for Material Design- Mots clés- Apprentissage automatique, Grands modèles de langages (LLMs), Problèmes inverses, Chémoinformatique, Design moléculaire/matériel, Spectroscopie vibrationnelle
- Machine learning, Large Language Models (LLMs), Inverse Problems, Chemoinformatics, Molecular/Material Design, Vibrational Spectroscopy**Description du sujet**:

- Les grands modèles de langage (LLMs), tels que GPT4, ChatGPT, Llama 2 et MISTRAL, ont révolutionné le domaine de l'apprentissage automatique. Récemment, les LLMs ont été adaptés avec succès dans le domaine de la chimie théorique, en raison de la représentation efficace des molécules par le biais des langages SMILES et SELFIES. Par ailleurs, la conception de matériaux et de molécules, qui consiste en la découverte de nouveaux composés moléculaires, est un domaine d'importance majeure, aux implications socio-technologiques multiples, et pour lequel la spectroscopie vibrationnelle représente une technique expérimentale essentielle. Ce projet propose une approche bi-disciplinaire du design moléculaire par le biais des LLMs et de la spectroscopie vibrationnelle. Premièrement, la prédiction de spectres vibrationnels à partir de SMILES/SELFIES moléculaires sera étudiée. Deuxièmement, le problème inverse, plus complexe, de la prédiction de SMILES/SELFIES à partir de spectres vibrationnels sera considéré, une direction qui n'a à ce jour jamais été réalisée. Plus généralement, ce projet constitue un progrès dans les domaines de la reconstruction moléculaire en design de matériaux, et des problèmes inverses en apprentissage automatique.
Large language models (LLMs), like GPT4, ChatGPT, Llama 2 and MISTRAL have revolutionized the field of Machine Learning. Recently, LLMs have been successfully adapted in the context of chemistry, due to the efficient representation of molecules by means of SMILES and SELFIES languages. Molecular/material design, which consists in the discovery of new molecules and materials, is a field of central importance, with multiple socio-technological implications, for which vibrational spectroscopy represents an essential experimental technique. This project proposes a bi-disciplinary approach to material design from the perspectives of LLMs and vibrational spectroscopy. In a first step, the prediction of vibrational spectra from molecular SMILES/SELFIES will be studied. In a second step, the challenging inverse problem of predicting SMILES/SELFIES from corresponding spectra will be considered - a direction which has never been achieved in the literature. Overall, this project constitutes a progress in the domains of molecular reconstruction in material design and inverse problems in machine learning.
Début de la thèse : 01/10/2024**Nature du financement**:
**Précisions sur le financement**:

- Contrats ED : Programme blanc GS-ISN*Programme AAP SPRINGCS - GS ISN**Présentation établissement et labo d'accueil**:

- Université Paris-Saclay GS Informatique et sciences du numérique**Etablissement délivrant le doctorat**:

- Université Paris-Saclay GS Informatique et sciences du numérique**Ecole doctorale**:

- 580 Sciences et Technologies de l'Information et de la Communication- The required skills for the cadidate are: strong background in ML and neural networks; very good programming skills, preferably in Python; experience with neural network libraries like PyTorch or Keras is strongly recom
- mended; prior knowledge in chemo-/bio-informatics would be a plus.-
- 12/05/2024

Plus d'emplois de Université Paris-Saclay GS Informatique et sciences du numérique