Doctorant F/H - Technopole de Sophia Antipolis, France - INRIA

    INRIA
    INRIA Technopole de Sophia Antipolis, France

    il y a 2 semaines

    Default job background
    CDD
    Description

    Contexte et atouts du poste

    Cette thèse s'intéresse aux graphes de connaissances (GCs), artefacts ayant pour objectif de capturer formellement les connaissances de mondes modélisés, leurs noeuds représentant des entités d'intérêt et leurs arêtes des relations entre ces entités. Ils sont par exemple utilisés pour l'intégration de données de sources multiples, la gestion de données distribuées, ou pour représenter des réseaux complexes dans de multiples domaines comme la biologie, la sociologie, ou les processus industriels. En particulier, nous considérons les GCs représentés avec les formalismes du Web Sémantique et les principes des Données Liées.

    Au sein du Web des données ou Web Sémantique, ces GCs sont représentés avec les langages RDF, SHACL, RDFS, et OWL standardisés par le World Wide Web Consortium (W3C), et sont interprétables à la fois par des humains et des agents logiciels, notamment des systèmes d'IA. En effet, les différents profils de OWL sont basés sur des logiques de description, permettant notamment à des agents IA l'utilisation de mécanismes de raisonnement déductif dans l'exploitation des GCs. RDFS supporte des raisonnements plus légers alors que SHACL est un langage de validation de contraintes structurelles. Et d'autres langages existent pour représenter des règles d'inférence au-dessus de RDF par exemple en étendant les langages SPARQL ou SHACL.

    Ces dernières années, de nombreux modèles d'IA non-symbolique ont également été proposés, par exemple les modèles de plongement de graphes et le graph machine learning.
    Ceux-ci manipulent avec performance les GCs et ont une grande capacité à faire face à l'hétérogéneité et au bruit inhérents à leurs processus de construction (semi-)automatiques ou en crowdsourcing.
    Dans une perspective d'IA neuro-symbolique, plusieurs auteurs ont étudié l'injection des connaissances symboliques des GCs dans de tels modèles afin d'améliorer leur performance.

    Plus récemment, des travaux encore peu nombreux se sont intéressés à l'utilisation du raisonnement par analogie pour les tâches du cycle de vie des GCs et ses interactions avec les modèles de plongement existants.

    Mission confiée

    Les GCs peuvent donc d'ores et déjà être manipulés par plusieurs types de traitements intelligents, ici l'apprentissage, le raisonnement déductif, la validation de contraintes et le raisonnement analogique.
    Néanmoins, actuellement, rien ne permet de facilement combiner différentes méthodes d'IA de façon synergique pour une tâche donnée.

    Pourtant nous, humains, combinons tous les jours ces facultés dans des tâches complexes.
    De plus, les entrées-sorties et les objectifs des processus intelligents peuvent être naturellement composables. Ainsi un processus d'induction pourra produire des contraintes d'intégrité (ex. en SHACL) qui seront en suite utilisées par un processus de validation et mais aussi par un autre processus de complétion de graphes.

    C'est pourquoi, nous proposons dans le cadre de cette thèse d'étudier comment manipuler des GCs avec différentes formes de traitements intelligents tout en favorisant leurs interactions en les implémentant sous forme d'agents autonomes.

    Principales activités

    Différentes formes de traitements intelligents.

    Afin de progresser vers une synergie entre types de processus intelligents dans une optique d'IA neuro-symbolique, nous étudierons comment manipuler et améliorer des GCs avec différentes formes de traitements intelligents (par exemple, raisonnement déductif, analogique, inductif). Nous considérerons les tâches d'amélioration de GCs : prédiction de liens, classification de liens, alignement d'entités. Il sera nécessaire d'étudier les différents traitements intelligents mis en oeuvre dans la littérature pour leur réalisation, leurs avantages, et leurs inconvénients. Cette étude permettra de pouvoir proposer de nouvelles approches pour la réalisation d'une tâche en utilisant un type de traitement intelligent actuellement non-considéré. Il sera également possible d'étudier d'autres tâches d'amélioration des GCs (par exemple, l'élagage) ou d'autres processus intelligent (par exemple, raisonnement plausible), en fonction des appétences du doctorant.

    Collaboration d'agents intelligents.

    Dans l'optique d'un faible couplage logiciel, chaque processus intelligent sera considéré comme un "module" indépendant, capable d'interagir avec des GCs pour mener à bien des tâches.
    Une telle manipulation sera facilitée par la flexibilité de la pile des standards des GCs qui permet de créer des piles alternatives pour travailler avec différentes vues (par exemple, vue graphe, vue logique de descriptions, vue règles d'inférences, vue contraintes d'intégrité, etc.) ou avec différents processus intelligents.
    En particulier, nous proposons d'étudier cette organisation sous la forme d'un système multi-agents (SMA), une architecture d'IA distribuée explicitement conçue pour organiser et faire collaborer des composants logiciels d'IA faiblement couplés et pouvant être rendue compatible avec l'architecture décentralisée du Web des Données. Ainsi une possibilité sera d'aller vers des architectures de type hMAS (Hypermedia Multi-Agent System), une architecture de systèmes multi-agents hautement compatible avec l'architecture Web.
    En bénéficiant de cette architecture multi-agents, nous proposerons un cadre pour une interaction entre modules / processus intelligents avant, pendant, et après leurs processus respectifs, afin de bénéficier des apports de chaque type pour améliorer globalement la qualité d'une collection de graphes de connaissances.

    Il est à noter que ce travail s'insèrera aussi dans la tendance actuelle à représenter et à négocier dans des GCs, sous forme de méta-données, les profils de raisonnements, et plus généralement les traitements, appliqués aux GCs publiés sur le Web.

    Dans cette vision, les GCs constitueront (i) le matériel en entrée des agents intelligents, (ii) la structure d'échange de leurs inférences (préliminaires, partielles, ou finales) leur permettant d'échanger et de consolider leurs résultats respectifs si nécessaire au cours de leur exécution, mais aussi (iii) le rôle de métadonnées pour décrire l'environnement dans lequel les agents évoluent évoluent, ses ressources, ses organisations et les autres agents.
    Les langages de représentation des GCs pourront donc être étendus pour représenter et décrire les traitements intelligents effectués au sein même des graphes (sur le modèle du langage OWL et du raisonnement déductif), incluant par exemple leurs paramètres, configurations, traitements, workflows, et protocoles d'interaction.

    Les GCs constitueront ainsi une structure unifiée et pivot pour représenter connaissances et agents intelligents, dans la continuité des travaux existants pour représenter la provenance et tracer les traitements sur le Web des Données.

    Compétences

    Compétences techniques et niveau requis : Web des données, données liées, Web sémantique, apprentissage automatique.

    Langages: Python, RDF/S, OWL, SPARQL

    Langues : Français, Anglais

    Aptitudes relationnelles : esprit d'équipe, autonomie, curiosité scientifique,

    Autres qualités appréciées : humour

    Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Participation mutuelle (sous conditions)
  • Rémunération

    Durée: 36 mois
    Localisation: Sophia Antipolis, France
    Rémunération: 2100€ brut mensuel (année 1 & 2) et 2190€ brut mensuel (année 3)