About Mickaël
- Conception et implémentation de plateformes data (data lake, data mesh, lakehouse)
- Architecture et développement de pipelines streaming temps réel
- Migration vers le cloud (AWS, Azure, Databricks)
- Mise en conformité GDPR et gouvernance data
- Refonte d'architectures legacy et optimisation de coûts
- Montée en compétences d'équipes data
French
Native or bilingual
English
Fluent
Experience
- BedrockTech Lead | Data EngineerSOFTWARE PUBLISHINGApril 2024 - Today (2 years and 2 months)Lyon, FranceContexte : Bedrock Streaming (groupe RTL/Bertelsmann) opère les plateformes de streaming vidéo M6+, RTL+, Videoland - 50M+ utilisateurs.Mission : concevoir et implémenter la nouvelle plateforme analytique data mesh au sein d'une équipe de 5 (flat organization).Défi : L'équipe data centralisée était un goulot d'étranglement: quasi-zéro nouveau produit data en 2024, time-to-market de plusieurs mois, intégration de nouveaux clients bloquante.Ce que j'ai mis en œuvre:
- Architecture : Migration data lake centralisé vers data mesh décentralisé. Conception architecture streaming: DynamoDB → Kinesis → Firehose → S3 → Databricks Spark Declarative Pipeline
- Infrastructure as Code : 7 Modules Terraform réutilisables (AWS : IAM, S3, KMS, Kinesis, Firehose, Lambda + Databricks : Unity Catalog, pipelines, jobs, alerts). Versioning sémantique.
- GDPR & Governance : Implémentation GDPR by design (tagging PII bi-weekly, droit à l'oubli sous 30j, audit trail), lineage tracking (DataHub + Unity Catalog), catalogage automatique. Membre comité data gouvernance.
- Enablement : Accompagnement de 4 équipes domaines (User, Payment, Catalog, Audience, Content) via workshops, pair programming, ADRs, unbooks GitHub, Slack dédié par domaine.
- IA assistée : Agent doc automatisé (Claude intégré VSCode), planification de migrations complexes, revue de PR et IaC.
Résultats mesurables :✓ 0->10 nouveaux produits streaming en 2025✓ Time to market : 4 semaines (vs plusieurs mois)✓ 5 domaines autonomes en production✓ Batch quotidien → near real-time✓ 7 modules Terraform réutilisables livrés✓ Architecture data mesh opérationnelle — migration de 5 domaines en cours (H1 2026)Stack : AWS (Kinesis, Firehose, Lambda, S3, KMS, Glue) • Databricks (Unity Catalog, Spark Declarative Pipeline) • Terraform • Python • DataHub • GitHub Actions - Campus Numérique in The AlpsFormateur DataEDUCATION AND E-LEARNINGJanuary 2024 - May 2025 (1 year and 4 months)Grenoble, FranceFormateur au Campus Numérique In the Alps, j'accompagne des apprenants Data Analyst/Engineer en voie de professionnalisation :Pédagogie active : 10% théorie / 90% pratique, approche projet-based centrée sur le "learning by doing"Domaines enseignés : ETL/ELT (Airflow, Docker), modélisation de données (UML, formes normales), data warehousing, big data (PySpark, architecture distribuée), cloud (Azure Synapse Analytics, Data Factory, Databricks)Accompagnement personnalisé : Support individuel adapté aux niveaux, mentoring sur projets réels, préparation à l'emploiApproche : Faire parler les apprenants pour les guider vers la solution plutôt que donner directement la réponse. Développer l'autonomie et la capacité de résolution de problèmes.Technologies : Python, SQL, Airflow, Docker, Azure, PySpark
- TVTYData EngineerSOFTWARE PUBLISHINGMarch 2021 - September 2023 (2 years and 6 months)Lyon, FranceContexte : Nielsen | TVTY mesure l'impact des campagnes TV sur le trafic web de 100+ annonceurs internationaux (Carglass, Dyson, Verisure).Pipeline data : collecte tag JavaScript → enrichissement APIs (Google Analytics, Ads) → transformation (attribution impact spots, agrégations) → exposition base de données.Défi principal : Anticipation dépréciation cookies tiers par les navigateurs, menaçant le cœur du modèle de collecte. Besoin urgent de refonte du système tracking tout en maintenant la continuité de service pour 100+ clients.Ma mission :Au sein d'une équipe data de 5 personnes en Scrum, j'ai assuré le maintien et l'évolution de l'infrastructure :
- Modernisation critique (6 mois) : Refonte complète du tag de collecte JavaScript pour anticiper la fin des cookies tiers. Spécifications, développement JS, étude d'impact, rollout progressif blue-green avec coexistence ancienne/nouvelle solution, validation client par client
- Extensibilité : Conception et développement de connecteurs Airflow personnalisés pour Google Analytics (GA3, GA4) et autres sources. Enrichissement automatique via multiples APIs
- Infrastructure distribuée : Maintenance cluster Hadoop AWS EMR gérant 100+ annonceurs. Architecture multi-tenant avec DAG Airflow par annonceur, chaque DAG avec branche par campagne + branche always-on pour données de référence
- IaC & DevOps : Gestion infrastructure as code (boto3, Ansible, Docker), déploiement environnements test/prod, CI/CD avec GitHub
- Support transverse : Référent technique data. Analyses ad hoc avec service client (EDA, visualisation Jupyter/Zeppelin), debugging production, optimisation requêtes
Réalisations :✓ Migration réussie vers nouveau système tracking sans interruption service✓ Infrastructure scalable supportant 100+ annonceurs simultanésStack : Python, JavaScript, Spark, Airflow, AWS EMR, MariaDB, GitLab, Docker
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Programme Freelance For Good, Devenir freelance dans le secteur de l'impactSocial DeclikProgramme Freelance For Good, Devenir freelance dans le secteur de l'impact
- Master 2 (M2), Mathématiques appliquéesUniversité du Maine-Le Mans-LavalMaster 2 (M2), Mathématiques appliquées