Stagiaire - Pilote de Projet Informatique Ia - Chusclan, France - CEA

CEA
CEA
Entreprise vérifiée
Chusclan, France

il y a 3 semaines

Sophie Dupont

Posté par:

Sophie Dupont

beBee Recruiter


Description
du poste

**Domaine**:

- Systèmes d'information

**Contrat**:

- Stage

**Intitulé de l'offre**:

- STAGIAIRE - Pilote de projet informatique IA - LLM(6 Mois rémunérés) H/F

**Sujet de stage**:

- Le stage a pour objectif d'évaluer le potentiel des LLMs couplés à la RAG pour aider les ingénieurs de la DDSD à analyser des dossiers de REX d'opérations de démantèlement, et d'en faire la synthèse, pour être sûr que le retour d'expérience est bien pris en compte dans les opérations de démantèlement actuelles et futures. L'objectif étant de valoriser et d'exploiter cette connaissance.
- Dans un premier temps le stagiaire devra constituer une base de données à partir de la masse documentaire disponible. Il cherchera ensuite à déterminer quel modèle (GPT3, LLAMA2, Mistral ) sera le plus adapté à l'analyse de ces données, et produira une preuve de concept permettant de valoriser les informations contenues dans ces bases.
- Le stage sera encadré par le responsable du calcul scientifique au STIC de Marcoule, dont la mission est d'accompagner les ingénieurs-chercheurs du CEA dans leurs travaux, en leur mettant à disposition des outils numériques (cluster de calcul, plateformes logicielles).

**Durée du contrat (en mois)**:

- 6

**Description de l'offre**:
**_Stage IA (LLM, RAG) pour extraire des informations d'une base documentaire sur le démantèlement nucléaire. H/F_**

Vous souhaitez enrichir vos compétences dans le domaine du nucléaire et réussir votre stage de fin d'études ?**N'hésitez plus, et rejoignez le CEA **

Dans le cadre de sa mission sur la gestion du retour d'expérience (REX) le service STRD/GQTE dispose d'un large base documentaire constituée de milliers de documents.- Cette documentation se compose de rapports techniques de retours d'expérience (REX), sous forme de PDF (ocerisés) et de base de connaissance type « WIKIMEDIA ».Les Large Language Models (LLMs) ont récemment montré leur capacité à assister les ingénieurs dans la rédaction de documentation technique, avec des outils comme ChatGPT. Les algorithmes de type RAG (Retrieval Augmented Generation) combinent les techniques de récupération de connaissances propres au domaine métier avec les techniques de génération qu'apportent les LLM. Les techniques RAG permettent de compléter les lacunes des LLMs : réduction des hallucinations, citation des sources des données, et meilleur lien effectué entre les faits extraits de différents documents.**Moyens / Méthodes / Logiciels**:

- "Environnent de travail Linux, GPU (CUDA) Python (langchain)

**De nôtre côté, nous cherchons un profil**:

- De formation d'ingénieur et/ou M2 en informatique avec un fort intérêt pour l'intelligence artificielle et les modèles de langage.

Compétences requises:
- Notions de base sur l'apprentissage automatique et les réseaux de neurones.
- Des connaissances ou une première expérience avec les LLMs serait appréciée
- Environnent de travail Linux, GPU (CUDA)
- Python (langchain)

**De votre côté, vous cherchez une entreprise**:
Qui développe vos compétences et construit votre parcours professionnel
- Qui donne une possibilité d'être en télétravail
- Qui prône la mixité et la diversité
- Qui est acteur majeur de la recherche dans le nucléaireLe CEA est un acteur engagé dans l'accueil, l'insertion et le maintien dans l'emploi des salariés en situation de handicap. Ainsi, si vous le souhaitez, vous pouvez également joindre tous documents justifiants de votre situation de handicap (RQTH, carte mobilité inclusion, pension d'invalidité, etc).Localisation du poste

**Site**:

- Marcoule

**Localisation du poste**:

- France, Occitanie, Gard (30)

**Ville**:

- Chusclan

**Langues**:

- Anglais (Intermédiaire)

**Diplôme préparé**:

- Bac+5 - Master 2

Demandeur

**Disponibilité du poste**:

- 02/04/2024

Informations générales

**Entité de rattachement**:
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
- Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
- Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
- Les collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales:
- La conscience des responsabilités
- La coopération
- La curiosité

**Référence **: **Description de l'unité**:

- La direction du démantèleme

Plus d'emplois de CEA