About Aymeric
Data Engineer & MLOps | Airflow, Python | Pipelines & ML en production (GCP, Azure)
- les pipelines sont instables ou difficiles à maintenir
- les données manquent de fiabilité
- les modèles ML restent au stade de POC
- Action Logement : industrialisation d’un pipeline qualité sur 1M+ logements
- Mecanicus : déploiement de modèles ML (computer vision, NLP, pricing) sur GCP avec API
- Orange / Ekimetrics : conception de pipelines cloud Azure & GCP pour ingestion et transformation de données
- Conception de pipelines data robustes (Airflow, DBT, Python)
- Industrialisation de modèles ML (batch / pipelines orchestrés)
- Déploiement et exploitation sur cloud (GCP, Azure)
- Fiabilisation des traitements (monitoring, gestion des erreurs, reprise)
- Mise en place de CI/CD data & ML
- Optimisation des performances et des coûts
French
Native or bilingual
English
Conversational
Experience
- Action Logement ServicesLead Data Engineer | Airflow / Data PlatformREAL ESTATEDecember 2024 - Today (1 year and 6 months)Paris, FranceProjet stratégique de structuration et d’orchestration de pipelines data pour le DataHub Action Logement.- Conception et orchestration de workflows data de production, d’ingestion et de transformation avec Apache Airflow, garantissant l’automatisation, la fiabilité et la traçabilité des traitements.- Optimisation de l’architecture PostgreSQL, déployée sur Kubernetes, pour assurer performance, scalabilité et robustesse.- Enrichissement, contrôle qualité et validation des données à différentes mailles via PostgreSQL et PySpark, renforçant la cohérence des jeux de données.- Sécurisation et automatisation des déploiements de pipelines (gestion des secrets, CI/CD, variables d’environnement), réduisant les risques de mise en production.- Encadrement technique et accompagnement de l’équipe sur les bonnes pratiques en Data Engineering et en orchestration.- Mise en place de tests automatisés et contrôles qualité, garantissant la fiabilité et la résilience des workflows.- Création d’un dashboard Metabase pour le suivi de la qualité des données et la diffusion d’indicateurs clés aux filiales.Résultat : Structuration d’une plateforme data robuste, capable de supporter des workflows critiques et des exigences fortes de qualité de données.
- ORANGESenior Data EngineerTELECOMMUNICATIONSMarch 2024 - November 2024 (8 months)Paris, FranceProjet de préparation et de valorisation des données marketing pour Orange (via Ekimetrics).- Développement d'un framework Python interne automatisant le téléchargement, la validation et l’intégration des données depuis un SFTP vers une landing zone Databricks.- Mise en place d’une architecture data en médaillon (bronze, silver, gold), pour structurer les pipelines ETL et fiabiliser les flux de données.- Déploiement et industrialisation d’un environnement DBT pour la gestion des transformations, les tests de qualité et le suivi du data lineage.- Formation et accompagnement de deux data analysts juniors sur les bonnes pratiques de Data Engineering et de Data Quality.- Création d’un dashboard Power BI pour le suivi de la qualité et la visibilité des jeux de données.Résultat : Amélioration de la fiabilité des pipelines marketing et réduction du temps de traitement des données.
- Action Logement ServicesData Engineer / Applied Data ScienceREAL ESTATENovember 2023 - March 2024 (5 months)Paris, FranceProjet de centralisation et valorisation des données immobilières chez Action Logement (via Ekimetrics), avec pour objectif de fiabiliser et exploiter les données du parc immobilier pour la détection des passoires thermiques et l’optimisation énergétique.- Conception et déploiement d’une plateforme data en couches sur Databricks et DBT pour assurer traçabilité et qualité des flux.- Conception d’un **algorithme de rapprochement et redressement d’adresses**, combinant **NLP, similarité sémantique et géocodage via API**, pour fiabiliser les localisations et enrichir les analyses métier.- Automatisation de la normalisation et du géocodage d’adresses via API pour améliorer la cohérence des localisations.- Mise en place de tests automatisés, reporting qualité et CI/CD sous Azure DevOps.- Supervision et automatisation des flux via **Azure Data Factory**.- Livraison de données géolocalisées exploitables métierpour visualisation interactive.Résultat : Fiabilisation du datalake, réduction des délais d’intégration et amélioration de l’exploitation des données énergétiques.
Reviews
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Architecte en technologie numérique, Programmation / développeur informatique, général422022Architecte en technologie numérique, Programmation / développeur informatique, général
- Expert informatique et système d'information422021RNCP Niveau 7 validé en alternance.