Sectorial Data Strategy - Paris, France - Capgemini Invent

Capgemini Invent

Entreprise vérifiée

Paris, France

il y a 4 semaines

Posté par:

Sophie Dupont

beBee Recruiter

Description

**Description Entreprise**:
Vous êtes convaincu(e) que ce sont les collaborateurs qui permettent aux organisations de s'adapter et de se transformer ? Vous recherchez une aventure collective à taille humaine au sein d'un cabinet de conseil de réputation internationale ?
- Si vous connaissez la différence entre un « merge » et un « rebase » et si « Alpine » ne vous évoque pas seulement des voitures de sport, alors rejoignez l'aventure Capgemini Invent.
- L'accompagnement des entreprises sur la digitalisation de leurs opérations est une priorité stratégique pour le Groupe Capgemini. La practice Sectorial Data Strategy (SDS) est une entité regroupant des profils variés couvrant tout le cycle de vie d'un projet data, allant du data engineer jusqu'au consultant digital, en passant par le data scientist ou l'UX designer. Notre champ d'intervention couvre:
- Industrialisation de projets data dans des secteurs variés (ex : life sciences, sustainability, etc.)
- Conception, accompagnement et mise en oeuvre de la stratégie de transformation digitale, au travers d'exercices d'idéation/expérimentation
- Lancement de nouveaux business models en partenariat avec les incubateurs / accélérateurs, les startups, les éditeurs technologiques ainsi que les clients Capgemini

SDS cherche à agrandir son equipe Data Engineering x DevOps au sein de son pole d'expertise tech. En aggissant en tant que membre d'une equipe distribuée et etroitement alignée avec les metiers de nos clients, il s'agit d'une opportunité de contribuer aux infrastructures data d'aujourd'hui et de demain. Savoir-faire et savoir-etre sont les leviers clés permettant de valoriser les données de nos clients à chaque iteration afin de contribuer quotidiennement de facon positive aux taches de leurs utilisateurs.

**Mission**:
En qualité de Data Engineer, vous serez un element crucial pour nos clients : s'assurer que leurs données soient collectées et circulent correctement et efficacement au sein de leurs infrastructures data. Vous serez intégré(e) en tant que contributeur(trice) clé à nos equipes projet et vous interviendrez chez nos clients sur des problématiques de stratégie de données telles que:

- Operationaliser des pipelines de données fiables, maintenables et securitaires (c-à-d collection, transformation, integration et monitoring des données) reposant sur des infrastructures distribuées dans des environnement cloud (ex : Microsoft Azure, AWS, GCP, Palantir Foundry), sur site ou hybrides en exploitant des outils d'orchestration modernes (ex : Docker, Kubernetes)
- Ameliorer les pratiques liées aux outils de versioning (ex : Git, DVC, MLFlow, etc.), de data lineage/workflow (ex : Azure Data Factory, Foundry Lineage, Airflow, etc.) et de suivi de la qualité des données (ex : Great Expectations, Foundry Expectations, etc.)
- Mettre en place et maintenance de pipelines d'integration et de distribution continue (ex : Azure DevOps, Jenkins, GitHub Actions, etc.) ainsi que le scripting/tooling necessaire à l'automatisation et monitoring de taches (Bash/Python)
- Respecter les pratiques de gouvernance des données de votre client pour appliquer les directives de sécurité pertinentes et traiter les données en alignement avec son niveau de restriction
- En interne, vous contribuerez à:
- Participer à l'évangélisation DevOps au sein de la communeauté Invent Data
- Participer à des activités de développement commercial, telles que répondre à des problèmes liés au numérique et aux données
- Structurer et partager vos connaissances sous forme de modules de formation pour les compétences internes
- Participer à des événements autour de la donnée

**Profils Recherchés**:
Vous êtes diplômé(e) d'une grande école d'ingénieur, spécialisé(e) en informatique et passionné(e) par les nouvelles technologies autour de la donnée. Fort(e) d'une précédente experience projet sur un cloud public (Microsoft Azure, AWS ou GCP), vous maitrisez les technologies de reference parmi lesquelles:

- Git pour la gestion de versions/branches (ex : gitflow, trunk-based development) et bonnes pratiques de développement collaboratif (ex : pull requests, code reviews, etc.)
- Python et son utilisation moderne (ex : PEP8, Python 2.x vs 3.x, type hinting, POO, programmation fonctionelle, asynchrone, etc.) et tout particulierement l'utilisation de tests unitaires (ex: py-test) et l'utilisation des librairies de traitement de données en Python (ex : pandas, numpy), idéalement à une echelle industrielle (ex : Spark, Flink, etc.)
- Docker pour le packaging mono/multi-container (Docker Compose), deploiement d'images depuis un registre (ex : Azure Container Registry, Docker Hub, etc.), configuration/construction des images (ex : credentials/secrets, base image,.dockerignore, multi-stage builds, etc.)
- En outre, une connaissance de un ou plusieurs des elements suivants ser