Assistant-e en Ingénierie Logicielle - Paris e, France - CNRS

CNRS
CNRS
Entreprise vérifiée
Paris e, France

il y a 2 semaines

Sophie Dupont

Posté par:

Sophie Dupont

beBee Recruiter


Description
Date Limite Candidature : jeudi 16 février 2023

**Informations générales**:
Référence : UMR8554-PHIDAU-001
Nombre de Postes : 1
Lieu de travail : PARIS 05
Date de publication : jeudi 26 janvier 2023
Type de contrat : CDD Technique/Administratif
Durée du contrat : 12 mois
Date d'embauche prévue : 1 mars 2023
Quotité de travail : Temps complet
Rémunération : Entre 2108 et 2172,74 € bruts mensuels
Niveau d'études souhaité : Bac+3
Expérience souhaitée : 1 à 4 années

**Missions**:
L'équipe travaille sur de grands ensembles de données (actuellement ~5T, et on estime qu'ils vont doubler), qui sont de très longs enregistrements audio (d'environ 16 heures chacun) et des métadonnées. Les enregistrements sont recueillis lorsque les enfants portent un appareil pendant des journées entières, au fur et à mesure que les enfants vaquent à leurs occupations, et capturent ainsi toutes les vocalisations des enfants (pleurs, rires, babillages, conversations) et celles des personnes qui les entourent, ainsi que d'autres bruits. Nous disposons de données pour plus de 1 000 enfants dans leurs familles, apprenant une ou plusieurs de plus de 15 langues, et grandissant sur les 5 continents. Nous réutilisons également d'autres jeux de données tels que CHILDES ) et des corpus de transcription+audio multilingues (par exemple, la bible).
Il existe de nombreuses possibilités d'élargir les compétences (par exemple, l'utilisation avancée de github, le versioning, la création de conteneurs comme docker, la gestion, la rédaction, etc. Il y aura également quelques opportunités de contribuer à la rédaction d'articles scientifiques, bien que cela ne soit pas obligatoire. Un mentorat régulier est utilisé pour aider les membres de l'équipe à clarifier leurs objectifs de carrière et à prendre des mesures pour les atteindre.

**Activités**:
Nettoyer et dépanner les ensembles de données (signaler les bogues/erreurs dans les annotations ou les métadonnées, et aider à les corriger), en les convertissant au format ChildProject si nécessaire.
Créer un code reproductible pour les analyses, en utilisant le format préféré de l'équipe (imbrication dans datalad).
Contribuer au débogage du code créé par l'équipe, en améliorant les pratiques de codage, notamment par le biais de la révision du code.
Interagir avec les autres membres de l'équipe qui développent du code pour l'apprentissage supervisé et non supervisé.
Contribuer au recrutement de stagiaires
Contribuer éventuellement à la rédaction d'articles scientifiques pour des revues ou des conférences.

**Compétences**:

- Ingénieur ou étudiant en master en linguistique computationnelle, sciences informatiques, science des données, intelligence artificielle ou statistiques.
- Connaissance des langages de script : python, basic bash.
- Connaissance des bonnes pratiques de programmation
- Autonomie, rigueur et organisation
- Bonnes capacités de communication (capacité à comprendre et à donner des instructions, à expliquer ce qui a été fait, etc.), notamment en anglais (mais un excellent anglais écrit n'est PAS nécessaire).
- Sens de l'écoute et des relations interpersonnelles

**Contexte de travail**:
L'objectif de notre équipe LAAC (Language Acquisition Across Cultures, voir site web) est de faire la lumière sur les mécanismes et les processus impliqués dans l'acquisition précoce du langage dans une variété de cultures et de communautés linguistiques. À cette fin, nous utilisons une approche interdisciplinaire (allant de la modélisation informatique aux expériences de laboratoire et à l'analyse avancée des données) dans le contexte d'une science ouverte, collaborative et engagée publiquement. Nous avons une culture de soutien, qui accepte la diversité culturelle et individuelle.

**Contraintes et risques**:
Il n'y a pas de contraintes ou de risques particuliers

**Informations complémentaires**:
ExELang )

Plus d'emplois de CNRS