Description

Consultant data engineering senior avec 26 ans d'expérience en développement logiciel dont les 6 dernières années spécialisé en ingénierie data, j'accompagne les entreprises dans la conception et la mise en œuvre de leurs plateformes data modernes, de l'architecture à la production.

Ce que je peux vous apporter :

✓ Architecture & Migration : Conception de plateformes data (data mesh, architecture distribuée), migration batch vers streaming temps réel, modernisation d'infrastructures

✓ Implémentation technique : Pipelines data robustes (batch/streaming), infrastructure as code (Terraform), intégration cloud (AWS, Databricks), conformité GDPR

✓ Autonomisation d'équipes : Formation technique, documentation, mise en place de standards et best practices, accompagnement au changement

Ma valeur ajoutée :

Mon profil atypique - 16 ans d'entrepreneuriat suivi de 6 ans en data engineering - me permet d'allier vision produit et expertise technique approfondie. Je comprends vos enjeux business autant que vos défis techniques.

Résultats concrets :

Sur ma dernière mission (plateforme streaming 50M+ utilisateurs), j'ai permis le passage de 0 nouveaux produits data à 10 produits streaming en production, time-to-market ramené à 4 semaines, 5 équipes domaines autonomes sur leurs data products, architecture data mesh opérationnelle.

Types de missions que je gère :

Conception et implémentation de plateformes data (data lake, data mesh, lakehouse)
Architecture et développement de pipelines streaming temps réel
Migration vers le cloud (AWS, Azure, Databricks)
Mise en conformité GDPR et gouvernance data
Refonte d'architectures legacy et optimisation de coûts
Montée en compétences d'équipes data

Stack technique : AWS (Kinesis, Firehose, Lambda, S3, Glue, EMR), Databricks (Unity Catalog, Spark Declarative Pipeline), Terraform, Airflow, Python, Docker, DataHub

Basé à Lyon, disponible en remote ou sur site. Discutons de votre projet data !

Industry field of expertise

Languages

French
Native or bilingual
English
Fluent

Workplace preferences

Can work on-site

Lyon (up to 30km), Paris (up to 10km)

Bedrock
Tech Lead | Data Engineer
SOFTWARE PUBLISHING
April 2024 - Today (2 years and 2 months)
Lyon, France
Contexte : Bedrock Streaming (groupe RTL/Bertelsmann) opère les plateformes de streaming vidéo M6+, RTL+, Videoland - 50M+ utilisateurs.
Mission : concevoir et implémenter la nouvelle plateforme analytique data mesh au sein d'une équipe de 5 (flat organization).
Défi : L'équipe data centralisée était un goulot d'étranglement: quasi-zéro nouveau produit data en 2024, time-to-market de plusieurs mois, intégration de nouveaux clients bloquante.

Ce que j'ai mis en œuvre:
Architecture : Migration data lake centralisé vers data mesh décentralisé. Conception architecture streaming: DynamoDB → Kinesis → Firehose → S3 → Databricks Spark Declarative Pipeline
Infrastructure as Code : 7 Modules Terraform réutilisables (AWS : IAM, S3, KMS, Kinesis, Firehose, Lambda + Databricks : Unity Catalog, pipelines, jobs, alerts). Versioning sémantique.
GDPR & Governance : Implémentation GDPR by design (tagging PII bi-weekly, droit à l'oubli sous 30j, audit trail), lineage tracking (DataHub + Unity Catalog), catalogage automatique. Membre comité data gouvernance.
Enablement : Accompagnement de 4 équipes domaines (User, Payment, Catalog, Audience, Content) via workshops, pair programming, ADRs, unbooks GitHub, Slack dédié par domaine.
IA assistée : Agent doc automatisé (Claude intégré VSCode), planification de migrations complexes, revue de PR et IaC.
Résultats mesurables :
✓ 0->10 nouveaux produits streaming en 2025
✓ Time to market : 4 semaines (vs plusieurs mois)
✓ 5 domaines autonomes en production
✓ Batch quotidien → near real-time
✓ 7 modules Terraform réutilisables livrés
✓ Architecture data mesh opérationnelle — migration de 5 domaines en cours (H1 2026)

Stack : AWS (Kinesis, Firehose, Lambda, S3, KMS, Glue) • Databricks (Unity Catalog, Spark Declarative Pipeline) • Terraform • Python • DataHub • GitHub Actions
Terraform AWS Databricks Data Mesh Tech Lead
Campus Numérique in The Alps
Formateur Data
EDUCATION AND E-LEARNING
January 2024 - May 2025 (1 year and 4 months)
Grenoble, France
Formateur au Campus Numérique In the Alps, j'accompagne des apprenants Data Analyst/Engineer en voie de professionnalisation :

Pédagogie active : 10% théorie / 90% pratique, approche projet-based centrée sur le "learning by doing"
Domaines enseignés : ETL/ELT (Airflow, Docker), modélisation de données (UML, formes normales), data warehousing, big data (PySpark, architecture distribuée), cloud (Azure Synapse Analytics, Data Factory, Databricks)
Accompagnement personnalisé : Support individuel adapté aux niveaux, mentoring sur projets réels, préparation à l'emploi

Approche : Faire parler les apprenants pour les guider vers la solution plutôt que donner directement la réponse. Développer l'autonomie et la capacité de résolution de problèmes.
Technologies : Python, SQL, Airflow, Docker, Azure, PySpark
Python SQL Data visualisation Pédagogie Microsoft Azure
TVTY
Data Engineer
SOFTWARE PUBLISHING
March 2021 - September 2023 (2 years and 6 months)
Lyon, France
Contexte : Nielsen | TVTY mesure l'impact des campagnes TV sur le trafic web de 100+ annonceurs internationaux (Carglass, Dyson, Verisure).
Pipeline data : collecte tag JavaScript → enrichissement APIs (Google Analytics, Ads) → transformation (attribution impact spots, agrégations) → exposition base de données.
Défi principal : Anticipation dépréciation cookies tiers par les navigateurs, menaçant le cœur du modèle de collecte. Besoin urgent de refonte du système tracking tout en maintenant la continuité de service pour 100+ clients.
Ma mission :
Au sein d'une équipe data de 5 personnes en Scrum, j'ai assuré le maintien et l'évolution de l'infrastructure :
Modernisation critique (6 mois) : Refonte complète du tag de collecte JavaScript pour anticiper la fin des cookies tiers. Spécifications, développement JS, étude d'impact, rollout progressif blue-green avec coexistence ancienne/nouvelle solution, validation client par client
Extensibilité : Conception et développement de connecteurs Airflow personnalisés pour Google Analytics (GA3, GA4) et autres sources. Enrichissement automatique via multiples APIs
Infrastructure distribuée : Maintenance cluster Hadoop AWS EMR gérant 100+ annonceurs. Architecture multi-tenant avec DAG Airflow par annonceur, chaque DAG avec branche par campagne + branche always-on pour données de référence
IaC & DevOps : Gestion infrastructure as code (boto3, Ansible, Docker), déploiement environnements test/prod, CI/CD avec GitHub
Support transverse : Référent technique data. Analyses ad hoc avec service client (EDA, visualisation Jupyter/Zeppelin), debugging production, optimisation requêtes
Réalisations :
✓ Migration réussie vers nouveau système tracking sans interruption service
✓ Infrastructure scalable supportant 100+ annonceurs simultanés

Stack : Python, JavaScript, Spark, Airflow, AWS EMR, MariaDB, GitLab, Docker
PySpark Airflow Data Engineering AWS Docker

Check out Mickaël's experience

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Programme Freelance For Good, Devenir freelance dans le secteur de l'impact
Social Declik
Programme Freelance For Good, Devenir freelance dans le secteur de l'impact
Master 2 (M2), Mathématiques appliquées
Université du Maine-Le Mans-Laval
Master 2 (M2), Mathématiques appliquées

Check out Mickaël's education

Data Engineer

Mickaël Vitry

Ingénieur Data Sénior

About Mickaël

Experience

Recommendations

These freelancer profiles also match your criteria

Education

Skill set

Categories