Extraction d'entités et de relations : Utiliser / entraîner / fine tuner des modèles de NER et des méthodes d'extraction de relations (règles linguistiques, apprentissage supervisé/faiblement supervisé) pour identifier et structurer les informations clés (personnes, organisations, événements, lieux).
Entity Linking et désambiguïsation : Lier les entités extraites à des références uniques (Wikidata, bases internes) et résoudre les ambigüités en s'appuyant sur des ontologies pour structurer les concepts.
Construction dynamique du graphe : Concevoir un pipeline pour peupler le graphe avec les entités et relations extraites, en garantissant la cohérence et la traçabilité des données (exemple d'outils : Neo4j, ArangoDB, NetworkX).
Définir des métriques de qualité (précision, rappel, cohérence) et des tests de graph completion pour évaluer la robustesse du graphe.
Optimiser le pipeline pour une mise à jour automatique et une scalabilité face à des volumes importants de données.
Agent de récupération d'information : Développer un agent capable d'interroger le graphe pour extraire des informations pertinentes en réponse à une requête utilisateur ou un prompt de LLM.
Filtrage des hallucinations : Utiliser le graphe comme source de vérité pour valider les réponses générées par un LLM, en croisant les informations avec les données structurées.
Pondération et pertinence : Implémenter des scores de confiance pour prioriser les informations les plus fiables et contextualisées avant leur intégration dans un prompt de LLM.
Scénarios d'utilisation :
Répondre à des questions complexes en s'appuyant sur le graphe.
Générer des résumés ou rapports automatisés en combinant les données du graphe avec un LLM.
Combinaison avec des techniques de QA : Associer le graphe à des modèles de Question Answering pour fournir des réponses précises, sourcées et explicables.
Approches few-shot : Adapter le système pour générer des réponses contextualisées à partir d'exemples tirés du graphe, améliorant ainsi la pertinence des résultats.
Réduction des hallucinations : Le graphe agit comme un filtre pour les réponses générées par les LLMs.
Automatisation intelligente : L'agent IA exploite le graphe pour enrichir dynamiquement les prompts d'un LLM, améliorant la qualité et la fiabilité des réponses.
LLM-empowered knowledge graph construction: A survey (arXiv, 2025) : Survey sur l'utilisation des LLM pour construire des knowledge graphs, incluant l'extraction d'entités/relations et l'ontologie automatisée. Frameworks comme GraphRAG et OntoRAG sont analysés, avec un focus sur la qualité et la réduction des hallucinations.
The construction and refined extraction techniques of knowledge graph based on large language models (Scientific Reports, 2026) : Méthodes de prompt engineering et LLM pour extraire et structurer des connaissances, en abordant la désambiguïsation et la qualité des triples.
KGGen: Extracting Knowledge Graphs from Plain Text with Language Models (arXiv, 2025) : Framework Microsoft (GraphRAG) pour générer des knowledge graphs à partir de texte, avec discussion sur les limites (bruit, incomplétude) et solutions d'amélioration.
Efficient Knowledge Graph Construction and Retrieval from Unstructured Text for Large-Scale RAG Systems (arXiv, 2025) : Stratégies d'indexation et de récupération dynamique de graphes à grande échelle, utilisant HyperTree Planning et RGL.
MEGA-RAG (PMC, 2025) : Framework RAG utilisant des knowledge graphs pour valider les réponses et réduire les hallucinations via des preuves multiples.
Mitigating Hallucination in LLMs (arXiv, 2025) : Survey sur les solutions anti-hallucinations (RAG, raisonnement, agents IA) et l'ancrage des réponses dans des données structurées.
GraphRAG (GitHub/ACL, 2025) : Framework open-source améliorant la précision des réponses en RAG grâce à des graphes, avec applications en finance et santé.
Hallucination Mitigation for RAG (MDPI, 2025) : Revue des limites du RAG classique et du rôle des knowledge graphs pour valider les réponses.
Revue de l'état de l'art : Étudier les méthodes existantes (Deep learning, apprentissage contrastif, multimodal learning, etc.).
Expérimentation : Tester et adapter les approches identifiées pour géolocaliser des images issues de sources OSINT.
Benchmark : Évaluer les performances des modèles (précision, robustesse, temps de calcul) sur des jeux de données variés.
Propositions d'améliorations et implémentations: Identifier les limites des solutions actuelles, suggérer des pistes innovantes pour les dépasser et implémenter.
Combinaison de techniques avancées pour une géolocalisation plus précise et fiable.
Développement de méthodes hybrides (vision + texte) pour enrichir les prédictions.
"GeoLocSFT: Efficient Visual Geolocation via Supervised Fine-Tuning of Multimodal Foundation Models" (2025): Ce récent papier explore comment affiner de grands modèles multimodaux pour la tâche de géolocalisation visuelle avec un dataset restreint mais diversifié, illustrant une direction différente centrée sur la supervision fine-tuned.
"PIGEON et PIGEOTTO" : Ces modèles combinent l'apprentissage contrastif multitâche, le pré-entraînement avec CLIP (Contrastive Language-Image Pre-Training), et une segmentation sémantique en géocellules. Ils ont été entraînés sur images issues de Geoguessr, permettant une géolocalisation mondiale précise même sans métadonnées. L'approche utilise une fonction de perte innovante pour affiner la prédiction de localisation, avec une robustesse accrue face à la diversité des paysages.
"GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization" (2023): Ce papier étend les idées de CLIP à la géolocalisation en alignant les images directement avec leurs coordonnées GPS, en représentant la Terre comme une fonction continue.
Pour le sujet Knowledge Graph : Python, NLP, Deep Learning, Hugging Face, LangChain, LangGraph, expérience en fine-tuning de modèles.
Pour le sujet Géolocalisation : Python, traitement d'images, Deep Learning, connaissance en géolocalisation ou bases de données géographiques.
Échange en visio avec Mélodie de notre équipe RH (précision du sujet d'intérêt).
Échange technique avec l'équipe data.
Début : possible à partir de début mars, avec flexibilité selon vos disponibilités.
Durée : 5 à 6 mois.
-
L'ingénieur(e) de recherche sera chargé(e) d'étendre et d'opérationnaliser l'outil IPSL-AID pour des applications en océanographie côtière. · Analyse de l’architecture du modèle IPSL-AID existant pour identifier les points d’extension et d’intégration optimaux. · Conception et in ...
Parisil y a 2 semaines
-
(EN version below ) · Qui sommes-nous ? · Retras est une startup deeptech en intelligence artificielle qui développe une application dédiée à la rééducation de la motricité en autonomie pour des patients post-AVC, Parkinson, traumatiques ou avec des troubles "dys", ... L'outil an ...
Paris, Île-de-il y a 1 semaine
-
Depuis plus de cent ans, L'Oréal opère selon l'idée que la beauté a besoin de la science. · ...
Aulnay-sous-Bois, Île-de-il y a 1 mois
-
Créer la beauté qui fait avancer le mundo. L'Oréal opère selon l'idée que la beauté a besoin de la science. · ...
Aulnay-sous-Boisil y a 1 mois
-
>> Description du stage << · En tant que stagiaire ML Research Engineer, vous contribuerez à concevoir et déployer des solutions d'intelligence artificielle avancées, au cœur de problématiques métiers concrètes et innovantes. Vous serez acteur(trice) de projets ambitieux, à l'int ...
Paris À temps pleinil y a 1 semaine
-
>> Description du stage << · En tant que stagiaire ML Research Engineer, vous contribuerez à concevoir et déployer des solutions d'intelligence artificielle avancées, au cœur de problématiques métiers concrètes et innovantes. Vous serez acteur(trice) de projets ambitieux, à l'int ...
Parisil y a 1 semaine
-
(EN version below ) · Qui sommes-nous ? · Retras est une startup deeptech en intelligence artificielle qui développe une application dédiée à la rééducation de la motricité en autonomie pour des patients post-AVC, Parkinson, traumatiques ou avec des troubles "dys", ... L'outil a ...
Fresnesil y a 1 semaine
-
· About the Institute of Foundation Models · We are a dedicated research lab for building, understanding, using, and risk-managing foundation models. Our mandate is to advance research, nurture the next generation of AI builders, and drive transformative contributions to a knowl ...
Paris 50.000 € - 90.000 € (EUR) par anil y a 1 semaine
-
+We help brands by democratizing best-in-class operations: scaling faster while delivering a five-star customer experience. · We are on a mission to change the logistics of e-commerce giants like Amazon and make fulfillment faster, smarter, and greener. · The Role · As a Research ...
Parisil y a 2 semaines
-
We help brands by democratizing best-in-class operations: scaling faster while delivering a five-star customer experience. · Identify optimization opportunities across our WMS algorithms · Align with stakeholders on operational feasibility and discuss tradeoffs · Develop and main ...
Paris, Île-de-il y a 2 semaines
-
· Paris | Full-time | Fluent & · E-commerce is booming — but independent brands still struggle to match the seamless logistics of giants like Amazon. At Bigblue, we're on a mission to change that. · We help brands by democratizing best-in-class operations: scaling faster while ...
Paris 28.000 € - 56.000 € (EUR) par anil y a 1 semaine
-
About ShareID delivers real-time secure authentication using official ID documents and a simple smile. Our AI-powered solution verifies IDs from over 120 countries with 99.9% accuracy confirms document ownership and ensures user liveness without storing personal data. · We are lo ...
Paris, Île-de-il y a 1 mois
-
We help brands by democratizing best-in-class operations: scaling faster while delivering a five-star customer experience. Since 2018, we've built a tech-driven logistics platform powering 500+ brands. With 110+ employees, our proprietary WMS (Warehouse Management System) Atlas, ...
Parisil y a 2 semaines
-
· About Mistral · At Mistral AI, we believe in the power of AI to simplify tasks, save time, and enhance learning and creativity. Our technology is designed to integrate seamlessly into daily working life. · We democratize AI through high-performance, optimised, open-source and ...
Paris, Ile-de-France, France 50.000 € - 90.000 € (EUR) par anil y a 9 heures
-
We help brands by democratizing best-in-class operations: scaling faster while delivering a five-star customer experience. · Either 4+ years of experience developing and applying optimization algorithms, or a PhD focused on applied optimization (i.e. Operation Research, Control T ...
Paris À temps pleinil y a 2 semaines
-
The Curie Institute Research Center is a major player in research and fight against cancer. · The RTOP team is seeking to recruit a highly qualified Research Engineer (Bioinformatician) with expertise in NGS-based analyses in pediatric oncology and rare tumors. · Demonstrated ex ...
Parisil y a 2 semaines
-
About us · At Diabolocom, we build AI systems that operate on real-world customer conversations across voice and text channels. These interactions are complex, highly unstructured, and require systems that function effectively even with limited labeled data. · As an AI Research ...
Paris 55.000 € - 85.000 € (EUR) par anil y a 1 semaine
-
Kog is a European VC-funded startup building the world's fastest AI execution layer. · ...
Paris À temps pleinil y a 1 mois
-
I'm hiring for a Senior AI Research Engineer for an already successful company pivoting into a new domain. · Up to €140,000 + Bonus · ...
Paris, Île-de-il y a 1 mois
-
+ Lead Research Engineer · We are seeking a unique profile: a deeply technical researcher/engineer who enjoys the craft of building models, but also possesses the maturity to lead a team and develop a roadmap. · + We are looking for someone who can bridge the gap between high-lev ...
Paris ()il y a 1 mois
-
We are seeking a Research Engineer to join our team dedicated to AI for Healthcare. In this role, you will engage in cutting-edge research into vital technologies underpinning next-generation models while simultaneously contributing to the exploration of various applications. · ...
Paris, Île-de-il y a 2 semaines
STAGE - ML Research Engineer - Paris - Sahar
Description
Description du stage
En tant que stagiaire ML Research Engineer, vous contribuerez à concevoir et déployer des solutions d'intelligence artificielle avancées, au cœur de problématiques métiers concrètes et innovantes. Vous serez acteur(trice) de projets ambitieux, à l'intersection du traitement automatique du langage, de la vision par ordinateur et de l'analyse de données hétérogènes.
Intégré(e) à une équipe pluridisciplinaire, vous collaborerez avec des experts en IA, ingénierie et sécurité pour prototyper, évaluer et industrialiser des solutions robustes, scalables et alignées sur les enjeux stratégiques de l'entreprise
Les sujets proposés s'articulent autour de défis techniques variés, tels que l'extraction et la structuration automatique d'informations OSINT (via des modèles de Named Entity Recognition, de Relation Extraction ou de fine-tuning de LLMs), ou encore la géolocalisation automatique d'images (en combinant Vision Transformers, feature matching et apprentissage contrastif).
Vous aurez l'opportunité de travailler sur des cas d'usage concrets, en exploitant des données textuelles, visuelles ou multimodales, et en contribuant activement à l'amélioration des pipelines d'IA.
Ce stage est une occasion unique de développer vos compétences en deep learning, machine learning, en traitement de données complexes et en recherche appliquée, dans un environnement dynamique et stimulant.
Sujets du stage
SUJET R&D 1 : Knowledge Graph et Agents IA
Contexte Ce stage a pour objectif de développer une méthode d'extraction et de structuration de connaissances sous forme de graphe, puis d'étudier son exploitation pour alimenter un agent IA en informations fiables et contextualisées.
Sujet du stage
FOCUS 1 : Développement d'une méthode automatisée de la construction de Knowledge Graph
1. Extraction et structuration des données
2. Évaluation et optimisation
FOCUS 2 : Exploitation de graphe et LLM
1. Intégration du graphe dans un système RAG
2. Application à un cas d'usage concret
Innovation et impact
Quelques papiers de recherches en rapport avec le sujet du stage
Extraction et structuration des données
Intégration du graphe dans un système RAG
SUJET R&D 2 : Géolocalisation Automatique d'Images (Geo-Guessing AI)
Contexte La géolocalisation d'images sans métadonnées est un enjeu majeur pour l'OSINT, la vérification d'informations et la sécurité. Ce stage a pour objectif de développer une solution d'IA capable d'estimer la localisation d'une image en combinant vision par ordinateur, feature matching et apprentissage multimodal.
Plan du stage
Innovation
Quelques papiers de recherches en rapport avec le sujet du stage
Méthodes avancées : Deep Learning, Apprentissage Contrastif, Multimodal
Profil recherché
Formation
Nous recherchons un(e) étudiant(e) en fin d'études de Master ou en école d'ingénieurs spécialisé(e) en machine learning, deep learning, sciences des données, ou dans un domaine connexe, avec une forte motivation pour la recherche appliquée et de bonnes compétences en programmation.
Compétences techniques (selon le sujet)
Qualités humaines essentielles Autonomie, curiosité, goût pour la R&D appliquée, intérêt pour l'OSINT, la recherche d'information, ou les systèmes hybrides.
Déroulé du process de recrutement
Modalités
#J-18808-Ljbffr
-
Research Engineer
Réservé aux membres inscrits Paris
-
Associate Lead Research Engineer
Réservé aux membres inscrits Paris, Île-de-
-
research engineer
Réservé aux membres inscrits Aulnay-sous-Bois, Île-de-
-
research engineer
Réservé aux membres inscrits Aulnay-sous-Bois
-
STAGE - ML Research Engineer
À temps plein Réservé aux membres inscrits Paris
-
STAGE - ML Research Engineer
Réservé aux membres inscrits Paris
-
Associate Lead Research Engineer
Réservé aux membres inscrits Fresnes
-
Research Engineer
Réservé aux membres inscrits Paris
-
Research Engineer
Réservé aux membres inscrits Paris
-
Research Engineer
Réservé aux membres inscrits Paris, Île-de-
-
Research Engineer
Réservé aux membres inscrits Paris
-
research engineer
Réservé aux membres inscrits Paris, Île-de-
-
Research Engineer
Réservé aux membres inscrits Paris
-
Research Engineer
Réservé aux membres inscrits Paris, Ile-de-France, France
-
Research Engineer
À temps plein Réservé aux membres inscrits Paris
-
Research Engineer Position
Réservé aux membres inscrits Paris
-
AI Research Engineer
Réservé aux membres inscrits Paris
-
Lead Research Engineer
À temps plein Réservé aux membres inscrits Paris
-
Video Research Engineer
Réservé aux membres inscrits Paris, Île-de-
-
Lead Research Engineer
Réservé aux membres inscrits Paris ()
-
Research Engineer, FrontierAI
Réservé aux membres inscrits Paris, Île-de-
