Post-Doctorant F/H Chercheur postdoctoral en IA responsable pour le journalisme - Palaiseau, France - INRIA

INRIA Palaiseau, France

il y a 3 jours

Description

Contexte et atouts du poste

Chaque année, la Direction des Relations Internationales d'Inria propose quelques postes postdoctoraux afin de soutenir les collaborations internationales.
Le contrat postdoctoral aura une durée de 12 à 24 mois. La date de début par défaut est le 1er novembre 2024 et au plus tard le 1er janvier 2025. Le postdoctorant sera recruté par l'un des Centres Inria de France mais il est recommandé que le temps soit partagé entre la France et le pays partenaire (attention que le postdoctorant doit commencer son contrat en France et que les visites doivent respecter Inria règles des missions).

Équipe:
Un chercheur postdoctoral potentiel intégrerait l'équipe Inria CEDAR tout en visitant l'équipe Human-Centered Data Analytics du CWI à Amsterdam. Ce projet est une collaboration avec les PI suivants :

Oana Balalau est chercheuse Inria au sein de l'équipe CEDAR, au centre Inria de l'Institut Polytechnique de Paris. Ses intérêts de recherche portent sur le traitement du langage naturel, en particulier sur la fouille d'argumentation, l'extraction d'informations et le data2text. Elle collabore avec des journalistes de plusieurs agences de presse : Radio France, Le Monde et AEF Info.
Davide Ceolin est chercheur au CWI au sein du groupe Human-Centered Data Analytics. Ses recherches portent sur la prévision transparente de multiples aspects de la qualité de l'information. Il est membre du laboratoire IA, médias et démocratie, un laboratoire multidisciplinaire qui étudie en profondeur les effets et les implications de l'IA pour les médias et la démocratie. Le laboratoire rassemble des chercheurs en informatique, droit et communication, ainsi que plusieurs partenaires de la société civile et industriels.

Les candidats intéressés peuvent contacter Oana Balalau s'ils ont des questions ().

Mission confiée

Les candidats aux postes postdoctoraux sont recrutés après la fin de leur doctorat ou après un premier post-doctorat : pour les candidats ayant obtenu leur doctorat dans l'hémisphère Nord, la date de la soutenance de la thèse sera après le 1er septembre 2022 ; dans l'hémisphère Sud après le 1er avril 2022. Afin de favoriser la mobilité, le poste postdoctoral doit se dérouler dans un environnement scientifique véritablement différent de celui du doctorat (et, le cas échéant, du poste occupé depuis le doctorat) ; une attention particulière aux candidats français ou internationaux ayant obtenu leur doctorat à l'étranger.

Contexte : Des systèmes de recommandation aux grands modèles de langage, les outils d'IA ont montré différentes formes de limitations et de biais [BHA, MMS, NFG]. Les biais dans les outils d'IA peuvent provenir de plusieurs facteurs, notamment les biais dans les données d'entraînement des outils d'IA, les biais de l'algorithme et les personnes responsables de la conception des outils d'IA, et les biais dans l'évaluation et l'interprétation des résultats des outils d'IA [NFG ]. Les limitations sont dues à des difficultés techniques dans la réalisation de tâches spécifiques [SB22]. Les médias utilisent différentes aides algorithmiques dans leur travail : extractions d'entités et de relations, extraction d'événements, analyse des sentiments, résumé automatique, production semi-automatique des nouvelles à l'aide de modèles de génération de texte, et la recherche guidée par l'IA, entre autres [TJM+ 22, UBM23]. Compte tenu de l'importance du secteur des médias pour nos démocraties, des problemes dans les outils qu'ils utilisent pourraient avoir de graves conséquences.

Principales activités

Sujet de recherche:

Quelles sont les sources potentielles de biais dans les applications de traitement du langage naturel (TAL) destinées au journalisme et comment pouvons-nous les mettre en évidence et atténuer leurs effets ?

Pour répondre à cette question, nous étudierons deux cas d'utilisation.

Biais et limites dans les tâches de classification. Nous avons développé une plateforme de vérification des faits grâce à laquelle les journalistes peuvent suivre les déclarations des hommes politiques sur les réseaux sociaux [BEG]. Les déclarations les plus susceptibles d'être vérifiables sont mises en évidence, et pour cela, nous avons utilisé un algorithme d'apprentissage automatique. Les affirmations vérifiables (en anglais checkworthy) sont définies comme des phrases factuelles dont le grand public voudra savoir si elles sont vraies [HAL]. Notons que cette définition s'appuie sur ce qu'un annotateur considère comme étant d'intérêt général. De plus, l'ensemble de données d'entraînement contient des déclarations politiques. Par conséquent, les annotateurs pourraient avoir introduit par inadvertance un biais politique dans leurs annotations, par exemple en qualifiant plus souvent des phrases dignes d'être vérifiées s'elles sont exprimées par une personne d'une affiliation politique différente de la leur. Un deuxième modèle utilisé dans notre pipeline est la détection de la propagande, où la propagande est définie comme un ensemble de techniques de communication conçues pour influencer un lecteur et non pour l'informer. Les arguments fallacieux, qui sont des arguments incorrects que les vérificateurs de faits devraient démystifier, sont particulièrement intéressants. Alors que les définitions de la propagande sont plus précises en fonction du type exact de technique (par exemple, langage chargé, ad hominem), les ensembles de données annotés ont souvent un faible accord entre annotateurs [DSB]. En outre, les ensembles de données ne contiennent également que des déclarations politiques – encore une fois, un annotateur pourrait être plus enclin à qualifier de propagande le discours d'une personne ayant une opinion politique différente. Nous aimerions déterminer si ces ensembles de données et ces modèles sont biaisés et, si tel est le cas, étudier comment il pourrait être possible de mettre en évidence ce biais. Une idée intéressante consiste à intégrer le désaccord dans une tâche de classification en fournissant une explication textuelle de la raison pour laquelle un certain paragraphe pourrait avoir deux ou plusieurs étiquettes différentes (également connue en ML sous le nom de classification multi-étiquettes) selon deux ou plusieurs opinions humaines différentes. Comme mentionné, le désaccord pourrait venir de la définition de la tâche mais aussi des convictions des annotateurs. Cela implique de repenser le processus d'annotation, la formation et l'évaluation d'un modèle TAL, ainsi que la manière dont un modèle est utilisé pour une application réelle. Nous notons que le problème de la variabilité et des biais dans l'annotation humaine retient de plus en plus l'attention dans la communauté TAL [P22, UFH].

Biais et limites dans les tâches génératives. De nos jours, les modèles linguistiques génératifs sont utilisés pour diverses tâches, notamment pour des essais ou des textes argumentatifs. Nous en avons discuté avec des journalistes, qui ont confirmé qu'ils utilisaient de tels outils pour accélérer leur travail. Nous souhaitons nous concentrer sur des textes argumentatifs, notamment sur des sujets controversés dans notre société. Pour étudier le biais potentiel des modèles argumentatifs lorsqu'on leur demande de fournir des informations sur de tels sujets, nous aimerions comparer les textes argumentatifs générés automatiquement avec des textes argumentatifs issus du crowdsourcing, tels que les textes hébergés sur les plateformes de débat. Ce projet peut être étendu à l'analyse de la manière dont les sujets controversés sont débattus dans la sphère publique, par exemple en se concentrant sur les débats des campagnes électorales en cours. Le premier défi technique de cette tâche consiste à identifier des arguments similaires - lorsqu'un argument est composé d'une affirmation et des preuves à l'appui de cette affirmation. La même affirmation peut être étayée par différentes preuves, et il est également important de mettre en évidence ces différences, car une préférence pour un certain type de preuves pourrait montrer des tendances plus importantes. Par exemple, l'affirmation « L'avortement devrait être légal ». peut être soutenu par « Une femme devrait toujours avoir le choix sur son corps ». ou la phrase « Dieu nous a donné le libre arbitre et nous devons respecter le libre arbitre des autres ». Un deuxième défi technique consiste à mesurer le degré de persuasion d'un texte argumentatif, par exemple en mesurant le degré d'exhaustivité des preuves présentées [HG16].

Les références:

[BEG] Balalau, O., Ebel, S., Galizzi, T., Manolescu, I., Massonnat, Q., Deiana, A., Gautreau, E., Krempf, A., Pontillon, T., Roux, G. and Yakin, J., 2022, October. Fact-checking Multidimensional Statistic Claims in French. In TTO 2022-Truth and Trust Online.

[BHA] Rishi Bommasani, Drew A Hudson, Ehsan Adeli, Russ Altman, Simran Arora, Sydney von Arx, Michael S Bernstein, Jeannette Bohg, Antoine Bosselut, Emma Brunskill, et al. On the opportunities and risks of foundation models. arXiv preprint arXiv: , 2021.

[DSB] Da San Martino, G., Seunghak, Y., Barrón-Cedeno, A., Petrov, R. and Nakov, P., 2019. Fine-grained analysis of propaganda in news article. In Proceedings of the 2019 conference on empirical methods in natural language processing and the 9th international joint conference on natural language processing (EMNLP-IJCNLP) (pp Association for Computational Linguistics.

[HAL] Hassan, N., Arslan, F., Li, C. and Tremayne, M., 2017, August. Toward automated fact-checking: Detecting check-worthy factual claims by claimbuster. In Proceedings of the 23rd ACM SIGKDD international conference on knowledge discovery and data mining (pp

[HG16] Habernal, I. and Gurevych, I., 2016, November. What makes a convincing argument? empirical analysis and detecting attributes of convincingness in web argumentation. In Proceedings of the 2016 conference on empirical methods in natural language processing (pp

[MMS] Ninareh Mehrabi, Fred Morstatter, Nripsuta Saxena, Kristina Lerman, and Aram Galstyan. A survey on bias and fairness in machine learning. ACM computing surveys (CSUR),54:1–35, 2021.

[NFG] Eirini Ntoutsi, Pavlos Fafalios, Ujwal Gadiraju, Vasileios Iosifidis, Wolfgang Nejdl, Maria Esther Vidal, Salvatore Ruggieri, Franco Turini, Symeon Papadopoulos, Emmanouil Krasanakis, et al. Bias in data-driven artificial intelligence systems—an introductory survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 10:e1356,2020.

[P22] Plank, B., 2022, December. The "Problem" of Human Label Variation: On Ground Truth in Data, Modeling and Evaluation. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (pp

[SB22] Chirag Shah and Emily M Bender. Situating search. In Proceedings of the 2022 Conference on Human Information Interaction and Retrieval, pages 221–232, 2022.

[TJM] Christoph Trattner, Dietmar Jannach, Enrico Motta, Irene Costera Meijer, Nicholas Diakopoulos, Mehdi Elahi, Andreas L Opdahl, Bjørnar Tessem, Nj ̊al Borch, Morten Fjeld, et al. Responsible media technology and ai: challenges and research directions. AI and Ethics, 2:585–594, 2022.

[UBM23] Prajna Upadhyay, Oana Balalau, and Ioana Manolescu. Open information extraction with entity focused constraints. In Findings of the Association for Computational Linguistics: EACL 2023, pages 1255–1266, 2023.

[UFH] Uma, A.N., Fornaciari, T., Hovy, D., Paun, S., Plank, B. and Poesio, M., 2021. Learning from disagreement: A survey. Journal of Artificial Intelligence Research, 72, pp

Compétences

Compétences techniques et niveau requis : solides connaissances en TAL et bonnes compétences en programmation

Langues : Anglais

Avantages

Restauration subventionnée

Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)

Possibilité de télétravail et aménagement du temps de travail

Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)

Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)

Accès à la formation professionnelle

Rémunération

Selon expérience

Stage Journalisme/communication

il y a 18 heures

Compagnie Agora Paris e, France

La Compagnie Agora recherche des stagiaires dans le journalisme et la communication pour des stages conventionnés maximum 2 mois à partir de Mars 2023. · **Votre profil**: · - Savoir s'organiser pour un stage en télétravail avec un véritable suivi régulier. · - Post Bac, Cours de ...
Stage Journalisme Et Communication

il y a 2 jours

Pangée ONG Paris e, France

**Qui sommes-nous?** · L'ONG Pangée ( association à but non-lucratif) recherche des bénévoles dans le cadre du community management. · L'ONG Pangée possède le statut ECOSOC.(consultatif auprès des Nations-Unies). · Cette ONG est le fondement de l'environnement Ingénierie de Paix ...
Intervenant Journalisme Freelance

il y a 1 semaine

BL-Education Paris, France

**Offre d'emploi intervenants Journalisme** · Nous recherchons des personnes qui ont un savoir faire particulier, une compétences ou une qualification dans un domaine; et qui sont intéressées pour intervenir auprès de structures éducatives (centre de loisirs, structures jeunesse, ...
Apprenti ou Stagiaire en Journalisme

il y a 6 jours

Fontenay-sous-bois Fontenay-sous-Bois, France

Le journal municipal de la ville de Fontenay-sous-Bois recherche un apprenti ou un stagiaire longue durée en journalisme (rédaction d'articles sur divers sujets) pour une durée d'un an à partir de janvier 2023. · **Profil**: · - Etudiant en master 1 ou 2 de journalisme dans une é ...
de rédaction journalisme culturel Stage

il y a 1 jour

La Fringale Culturelle France

La société LA FRINGALE CULTURELLE spécialisée dans le secteur de la presse indépendante recherche un(e) stagiaire motivé(e) et autonome ( stage non rémunéré ) à partir du 15/05/2024 . Vous intégrerez une petite équipe sympathique et dynamique pour le bon déroulement de notre act ...
Chargé de Communication Institutionnelle

il y a 2 jours

L'École polytechnique Palaiseau, France

Descriptif du poste · Rattaché(e) à la** Directrice de la Communication**, votre **mission principale **sera **d'assurer la rédaction de contenus éditoriaux institutionnels, **destinés à être diffusés sur différents supports en interne et en externe, pour valoriser l'image de l'E ...
Alternance : Community Manager Et Chargé de

il y a 18 heures

STUDIO URBAN Longjumeau, France

**Missions**: · En tant que Community Manager et Chargé de Production Vidéo en alternance, vous serez au cœur de notre stratégie de communication. Vos missions comprendront: · **Community Manager**: · - Gestion des réseaux sociaux d'un média urbain. · - Création de contenu engage ...
Chargé de Projet Editorial

il y a 5 jours

Pôle Emploi Antony, France

Le groupe Infopro Digital recrute pour son département événements un Chef de projets Editorial Evénements (F/H) pour le secteur de l'assurance. Vous travaillez en étroite collaboration avec nos rédactions, des journalistes experts et influents. Vos événements portent nos marques ...
Stagiaire Community Manager

il y a 3 jours

Welwot Antony, France

**Welwot Recherche**: · Un(e) Community Manager (Stage d'une durée de 3 mois minimum) · **Portrait de l'entreprise** · Fondée en 2021, Welwot est une start-up spécialisée dans le domaine de l'IOT et des nouvelles technologies. Nous développons des boitiers qui équipent des réseau ...
Journaliste - Enseignement journalisme scientifique F/H

il y a 3 jours

Diderot Education - Campus de Paris Paris, France Freelance / Indépendant, Temps partiel

L'entreprise · L'École de Gestion et Protection de la Nature (EGPN) est une école française spécialisée en écologie et habilitée à former des étudiants en Bac+3 (Bachelor of Science) et Bac+5 (Master of Science) aux fonctions d'écologue et d'expert naturaliste. · Description du p ...
Rédacteur Technique

il y a 1 jour

A4 Technologie Les Ulis, France

**Présentation de l'entreprise** · A4 propose des matériels pour les enseignements technologiques et les fablab. · Nous fournissons des matériels qui vont des imprimantes 3D aux brodeuses numériques, jusqu'aux mini-perceuses, outils à main etc. · **DESCRIPTION DU POSTE** · **Miss ...
Responsable Des Contenus

il y a 2 jours

IRSN Fontenay-aux-Roses, France

**Intitulé du poste**: · Responsable des contenus H/F · **Type de contrat**: · CDI · **Statut**: · Cadre · **Disponibilité du poste**: · 04/09/2023 · **Localisation du poste**: · Fontenay-aux-Roses · **Environnement / Organisation / Contexte**: · Au sein de la Direction de la Com ...
Responsable Des Contenus

il y a 1 jour

Institut de Radioprotection et de Sûreté Nucléaire Fontenay-aux-Roses, France

Descriptif du poste · Sous la responsabilité du responsable de la communication externe et en lien direct avec la cellule digitale, vous aurez comme mission: · Mettre en place et suivre un planning éditorial destiné aux réseaux sociaux · Anticiper et concevoir les contenus éditor ...
Responsable Communication

il y a 3 jours

AXELYO Saint-Michel-sur-Orge, France

Descriptif du poste · Sous la responsabilité de la directrice générale et du Directeur Commercial et en lien avec les différents services contributeurs, vous pilotez, coordonnez et mettez en œuvre les actions de communication et de marketing destinées au maintien d'une relation p ...
Redacteur Médical

il y a 1 semaine

Anderson RH Malakoff, France

Diplômé d'une école de journalisme avec un cursus scientifique ou professionnel de santé engagé dans le journalisme (DU d'information et journalisme médical, par exemple). · - Une première expérience de 3 ans minimum dans un poste similaire serait la bienvenue. · - Maitrise de l' ...
Journaliste Info/intox Les Observateurs de France 24

il y a 1 semaine

France Médias Monde Issy-les-Moulineaux, France

**Ecouter et regarder le monde** · Au sein de la Rédaction de France 24, vous êtes rattaché.e aux Observateurs - site internet et émission de · télévision de journalisme participatif. Sous l'autorité du rédacteur en chef de l'émission, vos missions · principales consisteront à: · ...
Charge de Communication Interne

il y a 1 semaine

INNOTHERA CORPORATE SERVICES Arcueil, France

Descriptif du poste · Rattaché(e) à la Responsable de la communication interne, vous contribuerez à la mise en place du plan de communication interne. **Missions principales**: · - Piloter et réaliser la newsletter interne · - Faire vivre les communications écrans · - Créer des c ...
Chargé de Communication éditoriale

il y a 3 jours

Ville de CACHAN Cachan, France

Filière: · **Administrative** · Métier: · **Communication** · Catégorie: · **A** · **Attaché territorial** · CDD ou titulaire · **CACHAN** · **(Val-de-Marne 94)** · **Titulaire ou contractuel** · Expérience: · **2 à 3 ans** · Rémunération statutaire + régime indemnitaire · Date l ...
Gps- Journaliste Médical

il y a 18 heures

GPS Malakoff, France

**Ce poste est rattaché au rédacteur en chef de la rédaction du**_ Quotidien du médecin._** · - Vous réaliserez une veille de l'information scientifique et de l'actualité médicale en lien direct avec la pratique de la médecine. · - Vous rédigerez des articles pour le et le magaz ...
Redacteur Junior Des Informations Professionnelles

il y a 18 heures

GPS Malakoff, France

Depuis plus de 50 ans, Le Quotidien du Médecin accompagne les médecins, généralistes et spécialistes, libéraux et hospitaliers, dans leur exercice professionnel. Chaque jour, il offre à ses lecteurs, avec rigueur, objectivité et indépendance, les informations essentielles à leur ...