Post-Doctorant F/H Chercheur postdoctoral en IA responsable pour le journalisme - Palaiseau, France - INRIA

INRIA Palaiseau, France

il y a 2 semaines

Description

Contexte et atouts du poste

Chaque année, la Direction des Relations Internationales d'Inria propose quelques postes postdoctoraux afin de soutenir les collaborations internationales.
Le contrat postdoctoral aura une durée de 12 à 24 mois. La date de début par défaut est le 1er novembre 2024 et au plus tard le 1er janvier 2025. Le postdoctorant sera recruté par l'un des Centres Inria de France mais il est recommandé que le temps soit partagé entre la France et le pays partenaire (attention que le postdoctorant doit commencer son contrat en France et que les visites doivent respecter Inria règles des missions).

Équipe:
Un chercheur postdoctoral potentiel intégrerait l'équipe Inria CEDAR tout en visitant l'équipe Human-Centered Data Analytics du CWI à Amsterdam. Ce projet est une collaboration avec les PI suivants :

Oana Balalau est chercheuse Inria au sein de l'équipe CEDAR, au centre Inria de l'Institut Polytechnique de Paris. Ses intérêts de recherche portent sur le traitement du langage naturel, en particulier sur la fouille d'argumentation, l'extraction d'informations et le data2text. Elle collabore avec des journalistes de plusieurs agences de presse : Radio France, Le Monde et AEF Info.
Davide Ceolin est chercheur au CWI au sein du groupe Human-Centered Data Analytics. Ses recherches portent sur la prévision transparente de multiples aspects de la qualité de l'information. Il est membre du laboratoire IA, médias et démocratie, un laboratoire multidisciplinaire qui étudie en profondeur les effets et les implications de l'IA pour les médias et la démocratie. Le laboratoire rassemble des chercheurs en informatique, droit et communication, ainsi que plusieurs partenaires de la société civile et industriels.

Les candidats intéressés peuvent contacter Oana Balalau s'ils ont des questions ().

Mission confiée

Les candidats aux postes postdoctoraux sont recrutés après la fin de leur doctorat ou après un premier post-doctorat : pour les candidats ayant obtenu leur doctorat dans l'hémisphère Nord, la date de la soutenance de la thèse sera après le 1er septembre 2022 ; dans l'hémisphère Sud après le 1er avril 2022. Afin de favoriser la mobilité, le poste postdoctoral doit se dérouler dans un environnement scientifique véritablement différent de celui du doctorat (et, le cas échéant, du poste occupé depuis le doctorat) ; une attention particulière aux candidats français ou internationaux ayant obtenu leur doctorat à l'étranger.

Contexte : Des systèmes de recommandation aux grands modèles de langage, les outils d'IA ont montré différentes formes de limitations et de biais [BHA, MMS, NFG]. Les biais dans les outils d'IA peuvent provenir de plusieurs facteurs, notamment les biais dans les données d'entraînement des outils d'IA, les biais de l'algorithme et les personnes responsables de la conception des outils d'IA, et les biais dans l'évaluation et l'interprétation des résultats des outils d'IA [NFG ]. Les limitations sont dues à des difficultés techniques dans la réalisation de tâches spécifiques [SB22]. Les médias utilisent différentes aides algorithmiques dans leur travail : extractions d'entités et de relations, extraction d'événements, analyse des sentiments, résumé automatique, production semi-automatique des nouvelles à l'aide de modèles de génération de texte, et la recherche guidée par l'IA, entre autres [TJM+ 22, UBM23]. Compte tenu de l'importance du secteur des médias pour nos démocraties, des problemes dans les outils qu'ils utilisent pourraient avoir de graves conséquences.

Principales activités

Sujet de recherche:

Quelles sont les sources potentielles de biais dans les applications de traitement du langage naturel (TAL) destinées au journalisme et comment pouvons-nous les mettre en évidence et atténuer leurs effets ?

Pour répondre à cette question, nous étudierons deux cas d'utilisation.

Biais et limites dans les tâches de classification. Nous avons développé une plateforme de vérification des faits grâce à laquelle les journalistes peuvent suivre les déclarations des hommes politiques sur les réseaux sociaux [BEG]. Les déclarations les plus susceptibles d'être vérifiables sont mises en évidence, et pour cela, nous avons utilisé un algorithme d'apprentissage automatique. Les affirmations vérifiables (en anglais checkworthy) sont définies comme des phrases factuelles dont le grand public voudra savoir si elles sont vraies [HAL]. Notons que cette définition s'appuie sur ce qu'un annotateur considère comme étant d'intérêt général. De plus, l'ensemble de données d'entraînement contient des déclarations politiques. Par conséquent, les annotateurs pourraient avoir introduit par inadvertance un biais politique dans leurs annotations, par exemple en qualifiant plus souvent des phrases dignes d'être vérifiées s'elles sont exprimées par une personne d'une affiliation politique différente de la leur. Un deuxième modèle utilisé dans notre pipeline est la détection de la propagande, où la propagande est définie comme un ensemble de techniques de communication conçues pour influencer un lecteur et non pour l'informer. Les arguments fallacieux, qui sont des arguments incorrects que les vérificateurs de faits devraient démystifier, sont particulièrement intéressants. Alors que les définitions de la propagande sont plus précises en fonction du type exact de technique (par exemple, langage chargé, ad hominem), les ensembles de données annotés ont souvent un faible accord entre annotateurs [DSB]. En outre, les ensembles de données ne contiennent également que des déclarations politiques – encore une fois, un annotateur pourrait être plus enclin à qualifier de propagande le discours d'une personne ayant une opinion politique différente. Nous aimerions déterminer si ces ensembles de données et ces modèles sont biaisés et, si tel est le cas, étudier comment il pourrait être possible de mettre en évidence ce biais. Une idée intéressante consiste à intégrer le désaccord dans une tâche de classification en fournissant une explication textuelle de la raison pour laquelle un certain paragraphe pourrait avoir deux ou plusieurs étiquettes différentes (également connue en ML sous le nom de classification multi-étiquettes) selon deux ou plusieurs opinions humaines différentes. Comme mentionné, le désaccord pourrait venir de la définition de la tâche mais aussi des convictions des annotateurs. Cela implique de repenser le processus d'annotation, la formation et l'évaluation d'un modèle TAL, ainsi que la manière dont un modèle est utilisé pour une application réelle. Nous notons que le problème de la variabilité et des biais dans l'annotation humaine retient de plus en plus l'attention dans la communauté TAL [P22, UFH].

Biais et limites dans les tâches génératives. De nos jours, les modèles linguistiques génératifs sont utilisés pour diverses tâches, notamment pour des essais ou des textes argumentatifs. Nous en avons discuté avec des journalistes, qui ont confirmé qu'ils utilisaient de tels outils pour accélérer leur travail. Nous souhaitons nous concentrer sur des textes argumentatifs, notamment sur des sujets controversés dans notre société. Pour étudier le biais potentiel des modèles argumentatifs lorsqu'on leur demande de fournir des informations sur de tels sujets, nous aimerions comparer les textes argumentatifs générés automatiquement avec des textes argumentatifs issus du crowdsourcing, tels que les textes hébergés sur les plateformes de débat. Ce projet peut être étendu à l'analyse de la manière dont les sujets controversés sont débattus dans la sphère publique, par exemple en se concentrant sur les débats des campagnes électorales en cours. Le premier défi technique de cette tâche consiste à identifier des arguments similaires - lorsqu'un argument est composé d'une affirmation et des preuves à l'appui de cette affirmation. La même affirmation peut être étayée par différentes preuves, et il est également important de mettre en évidence ces différences, car une préférence pour un certain type de preuves pourrait montrer des tendances plus importantes. Par exemple, l'affirmation « L'avortement devrait être légal ». peut être soutenu par « Une femme devrait toujours avoir le choix sur son corps ». ou la phrase « Dieu nous a donné le libre arbitre et nous devons respecter le libre arbitre des autres ». Un deuxième défi technique consiste à mesurer le degré de persuasion d'un texte argumentatif, par exemple en mesurant le degré d'exhaustivité des preuves présentées [HG16].

Les références:

[BEG] Balalau, O., Ebel, S., Galizzi, T., Manolescu, I., Massonnat, Q., Deiana, A., Gautreau, E., Krempf, A., Pontillon, T., Roux, G. and Yakin, J., 2022, October. Fact-checking Multidimensional Statistic Claims in French. In TTO 2022-Truth and Trust Online.

[BHA] Rishi Bommasani, Drew A Hudson, Ehsan Adeli, Russ Altman, Simran Arora, Sydney von Arx, Michael S Bernstein, Jeannette Bohg, Antoine Bosselut, Emma Brunskill, et al. On the opportunities and risks of foundation models. arXiv preprint arXiv: , 2021.

[DSB] Da San Martino, G., Seunghak, Y., Barrón-Cedeno, A., Petrov, R. and Nakov, P., 2019. Fine-grained analysis of propaganda in news article. In Proceedings of the 2019 conference on empirical methods in natural language processing and the 9th international joint conference on natural language processing (EMNLP-IJCNLP) (pp Association for Computational Linguistics.

[HAL] Hassan, N., Arslan, F., Li, C. and Tremayne, M., 2017, August. Toward automated fact-checking: Detecting check-worthy factual claims by claimbuster. In Proceedings of the 23rd ACM SIGKDD international conference on knowledge discovery and data mining (pp

[HG16] Habernal, I. and Gurevych, I., 2016, November. What makes a convincing argument? empirical analysis and detecting attributes of convincingness in web argumentation. In Proceedings of the 2016 conference on empirical methods in natural language processing (pp

[MMS] Ninareh Mehrabi, Fred Morstatter, Nripsuta Saxena, Kristina Lerman, and Aram Galstyan. A survey on bias and fairness in machine learning. ACM computing surveys (CSUR),54:1–35, 2021.

[NFG] Eirini Ntoutsi, Pavlos Fafalios, Ujwal Gadiraju, Vasileios Iosifidis, Wolfgang Nejdl, Maria Esther Vidal, Salvatore Ruggieri, Franco Turini, Symeon Papadopoulos, Emmanouil Krasanakis, et al. Bias in data-driven artificial intelligence systems—an introductory survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 10:e1356,2020.

[P22] Plank, B., 2022, December. The "Problem" of Human Label Variation: On Ground Truth in Data, Modeling and Evaluation. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (pp

[SB22] Chirag Shah and Emily M Bender. Situating search. In Proceedings of the 2022 Conference on Human Information Interaction and Retrieval, pages 221–232, 2022.

[TJM] Christoph Trattner, Dietmar Jannach, Enrico Motta, Irene Costera Meijer, Nicholas Diakopoulos, Mehdi Elahi, Andreas L Opdahl, Bjørnar Tessem, Nj ̊al Borch, Morten Fjeld, et al. Responsible media technology and ai: challenges and research directions. AI and Ethics, 2:585–594, 2022.

[UBM23] Prajna Upadhyay, Oana Balalau, and Ioana Manolescu. Open information extraction with entity focused constraints. In Findings of the Association for Computational Linguistics: EACL 2023, pages 1255–1266, 2023.

[UFH] Uma, A.N., Fornaciari, T., Hovy, D., Paun, S., Plank, B. and Poesio, M., 2021. Learning from disagreement: A survey. Journal of Artificial Intelligence Research, 72, pp

Compétences

Compétences techniques et niveau requis : solides connaissances en TAL et bonnes compétences en programmation

Langues : Anglais

Avantages

Restauration subventionnée

Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)

Possibilité de télétravail et aménagement du temps de travail

Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)

Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)

Accès à la formation professionnelle

Rémunération

Selon expérience

Conseiller en Journalisme

il y a 1 semaine

SCIENCES PO Paris, France

L'École de journalisme de Sciences Po est l'une des quatorze écoles reconnues par la profession. Ses programmes reposent sur une double exigence : l'approfondissement de savoirs académiques en sciences sociales sur les enjeux du monde de demain, propres à Sciences Po, indispensab ...
Stage Journalisme

il y a 3 jours

LIBERATION Paris e, France

Journaliste stagiaire - Service Environnement · Sa rédaction engagée, sa liberté de ton, et sa capacité à bousculer les idées reçues en font une marque de presse de référence qui rayonne dans le paysage des médias en France. · Nous sommes à la recherche d'un.e stagiaire pour une ...
Stage en Journalisme

il y a 1 semaine

Nirvana Club Paris e, France

**Edoni - Better Sexlife. Better Life.** · Edoni a pour mission de d'aider la planète a avoir une sexualité plus épanouie, seul.e ou en couple, puisqu'on pense que c'est tout simplement une des clés du bonheur. · On développe une parcours d'exercices à faire (comme un programme d ...
Stage Journalisme/communication

il y a 2 semaines

Compagnie Agora Paris e, France

La Compagnie Agora recherche des stagiaires dans le journalisme et la communication pour des stages conventionnés maximum 2 mois à partir de Mars 2023. · **Votre profil**: · - Savoir s'organiser pour un stage en télétravail avec un véritable suivi régulier. · - Post Bac, Cours de ...
Apprentissage - Journalisme Parentalité

il y a 2 semaines

Varenne Media Paris e, France

**Missions et responsabilités** · NEUF MOIS, recherche un/une journaliste en alternance pour renforcer son équipe. La personne fera partie de l'équipe responsable de la production de contenus rédactionnels et/ou multimédia liés à des sujets de parentalité et de santé. · **Secteur ...
Journalisme/communication Audiovisuelle en

il y a 1 semaine

CNES - Centre National d'Etudes Spatiales Paris er, France

Contrat d'alternance (pro, apprentissage), 12-24 mois · - Temps plein · - Aucune expérience exigée · - Master, DESS, DEA, Bac+5 · - Communication et Relations publiques · **Mission**: · **Contexte** · Au sein de la Direction de la Communication du CNES, le service Communication n ...
Stage Journalisme Et Communication

il y a 2 semaines

Pangée ONG Paris e, France

**Qui sommes-nous?** · L'ONG Pangée ( association à but non-lucratif) recherche des bénévoles dans le cadre du community management. · L'ONG Pangée possède le statut ECOSOC.(consultatif auprès des Nations-Unies). · Cette ONG est le fondement de l'environnement Ingénierie de Paix ...
Alternant Communication Journalisme

il y a 3 jours

SNCF Paris, France

La Direction de la communication de SNCF Réseau recherche ses futurs alternants La Direction de la communication accompagne la mise en œuvre du projet stratégique d'entreprise, porte le développement d'une mobilité durable et garantit la cohérence de la communication de marque. R ...
Intervenant Journalisme Freelance

il y a 1 semaine

BL-Education Paris, France

**Offre d'emploi intervenants Journalisme** · Nous recherchons des personnes qui ont un savoir faire particulier, une compétences ou une qualification dans un domaine; et qui sont intéressées pour intervenir auprès de structures éducatives (centre de loisirs, structures jeunesse, ...
Apprenti ou Stagiaire en Journalisme

il y a 3 semaines

Fontenay-sous-bois Fontenay-sous-Bois, France

Le journal municipal de la ville de Fontenay-sous-Bois recherche un apprenti ou un stagiaire longue durée en journalisme (rédaction d'articles sur divers sujets) pour une durée d'un an à partir de janvier 2023. · **Profil**: · - Etudiant en master 1 ou 2 de journalisme dans une é ...
Intervenants Journalisme Freelance

il y a 1 semaine

BL-Education Paris, France

**Offre d'emploi intervenants Journalisme** · Nous recherchons des personnes qui ont un savoir faire particulier, une compétences ou une qualification dans un domaine; et qui sont intéressées pour intervenir auprès de structures éducatives (centre de loisirs, structures jeunesse, ...
Apprentissage - Journalisme Lifestyle Et Voyage

il y a 2 semaines

Varenne Media Paris e, France

**Missions et responsabilités** · **Secteur d'activité** · **Expérience, formation et compétences souhaitées** · Doté(e) d'excellentes capacités rédactionnelles et d'une grande disponibilité, vous êtes passionné(e) des thématiques féminines en général (Mode, Maquillage, Psycho, S ...
Stage Journalisme Tourisme Et Gastronomie

il y a 2 semaines

Varenne Media - Paris Paris e, France

Découvrir la production éditoriale · - Découvrir l'optimisation digitale · - Découvrir la gestion opérationnelle des sites : benchmarking, brief, appels, réunions, suivi opérationnel · - Gérer les contacts avec les influenceurs et les marques · De formation supérieure en marketin ...
Stage de Rédaction/journalisme

il y a 2 jours

IGOSEO Paris e, France

IGOSEO Agence de référencement naturel, propose divers services, la création de site Internet, communication, référencement naturel et payant et conseil en stratégie digitale. · IGOSEO recherche un(e) étudiant(e) en communication / journalisme / lettres, qui aime écrire pour nous ...
Professeur de Journalisme Audiovisuel en Milieu

il y a 2 semaines

ATDP COMPANY Paris, France

Nous recherchons un/e journaliste pour animer des ateliers périscolaires de **JOURNALISME-** **AUDIOVISUEL **à destination d'enfants d'élémentaires (CP-CM2) pour **l'année scolaire 2024/2025.** · Cet atelier vise à enseigner aux enfants les **bases du journalisme et à produire un ...
Stagiaire en Rédaction, Journalisme, Communication

il y a 1 jour

AppASO Paris e, France

**Description de l'offre** · Nous recherchons un/une stagiaire en rédaction, journalisme, communication et relations presse pour renforcer notre équipe. · **Missions**: · - Rédiger des articles de blog et des contenus pour linkedin · - Entretenir les relations avec les médias pou ...
Stage - Rédacteur(Trice) Web Journalisme

il y a 1 jour

ISOVA Paris e, France

**Qui sommes nous ?** · Acteur majeur de la transition énergétique, ISOVA tire notamment parti de son expertise en matière d'économie d'énergie et écologique. · **Descriptif du poste**: · Chez ISOVA, nous favorisons l'enseignement et la bonne humeur En nous rejoignant, tu intègre ...
de rédaction journalisme culturel Stage

il y a 2 semaines

La Fringale Culturelle France

La société LA FRINGALE CULTURELLE spécialisée dans le secteur de la presse indépendante recherche un(e) stagiaire motivé(e) et autonome ( stage non rémunéré ) à partir du 15/05/2024 . Vous intégrerez une petite équipe sympathique et dynamique pour le bon déroulement de notre act ...
Chargé de Communication Institutionnelle

il y a 2 semaines

L'École polytechnique Palaiseau, France

Descriptif du poste · Rattaché(e) à la** Directrice de la Communication**, votre **mission principale **sera **d'assurer la rédaction de contenus éditoriaux institutionnels, **destinés à être diffusés sur différents supports en interne et en externe, pour valoriser l'image de l'E ...
Rédactrice ou Rédacteur Scientifique

il y a 1 semaine

Institut Mines-Télécom Palaiseau, France

**ENVIRONNEMENT DU POSTE**: · **L'Institut Mines-Télécom** est le 1er groupe public de Grandes Écoles d'ingénieurs et de management de France. · Constitué de huit Grandes Écoles publiques et de deux écoles filiales, l'Institut Mines-Télécom anime et développe un riche écosystème ...