Architecte Big Data H/F - Paris, France - MICHAEL PAGE

    MICHAEL PAGE
    MICHAEL PAGE Paris, France

    il y a 1 semaine

    Michael Page background
    CDI
    Description

    Poste : Vos missions en tant qu'Architecte Big Data seront de :

    * Analyser le besoin des porteurs de projet,
    * Identifier des caractéristiques clefs du SI, de son architecture globale,
    * Effectuer le choix et le dimensionnement des composants et des solutions logicielles et matérielles,
    * Prendre en compte des contraintes juridiques, sécuritaires et d'exploitation/administration des systèmes.

    Vous coordonnez le développement sur deux systèmes. Un système temporaire est basé sur une collaboration avec l'Inserm et leurs infrastructures pour la recherche en génomique et un système définitif pour l'intégration des données qui doit être créé intégralement. Vous assurez le lien avec les collaborateurs internes et externes, pour toutes les composantes fonctionnelles principales : Insertion des données, stockage, calcul intensif, gestion des droits, pseudonimisation/anonymisation, mesure et optimisation des performances, reporting d'activité?

    Vous effectuez une veille technologique, participez activement à la rédaction des cahiers des charges et appels d'offres et fait office de référent technologique envers tous les interlocuteurs internes (Chief Data Officer, Data Scientists, RSSI, équipe devops, experts techniques) et externes.
    Profil : Formation de niveau Bac +5 minimum, master spécialisé en informatique, réseaux et télécommunications.

    Expertise des principes d'urbanisation d'un système d'information. Maîtrise des architectures et technologies usuelles Big Data (par ex ecosystème hadoop, NoSQL, Hive, Spark, ElasticSearch?), des outils et standards d'infrastructure actuels (eg docker), de son écosystème open-source, des types de bases de données. Maîtrise des offres matérielles actuelles (GPU, stockage).

    Bonne maîtrise des protocoles de sécurité, réseau et télécoms.

    Une connaissance sommaire des référentiels de sécurité serait un plus (PGSSI-E, entrepôt de données, HDS, sec-num cloud, SNDS et du RGPD).
    Entreprise : Le Collecteur Analyseur de Données (CAD) est un Groupement d'Intérêt Public (GIP) créé dans le cadre du Plan France Médecine Génomique 2025. Son objectif principal est de construire une infrastructure sécurisée pour héberger et mettre à disposition des données de génomique humaine à des fins de soin et de recherche. Le CAD développe une infrastructure informatique pour recueillir et distribuer ces données, exploitant le calcul haute performance et des centres dédiés, avec des services répondant aux normes de sécurité en santé. Il favorise également la collaboration en reliant des entrepôts de données français et européens et offre des environnements sécurisés pour les chercheurs.