About Aymeric
Data Engineer & MLOps | Airflow, Python | Pipelines & ML en production (GCP, Azure)
- les pipelines sont instables ou difficiles à maintenir
- les données manquent de fiabilité
- les modèles ML restent au stade de POC
- Action Logement : industrialisation d’un pipeline qualité sur 1M+ logements
- Mecanicus : déploiement de modèles ML (computer vision, NLP, pricing) sur GCP avec API
- Orange / Ekimetrics : conception de pipelines cloud Azure & GCP pour ingestion et transformation de données
- Conception de pipelines data robustes (Airflow, DBT, Python)
- Industrialisation de modèles ML (batch / pipelines orchestrés)
- Déploiement et exploitation sur cloud (GCP, Azure)
- Fiabilisation des traitements (monitoring, gestion des erreurs, reprise)
- Mise en place de CI/CD data & ML
- Optimisation des performances et des coûts
French
Native or bilingual
English
Conversational
Experience
- Action Logement ServicesLead Data Engineer | Airflow / Data PlatformREAL ESTATEDecember 2024 - Today (1 year and 7 months)Paris, FranceProjet stratégique de structuration et d’orchestration de pipelines data pour le DataHub Action Logement.- Conception et orchestration de workflows data de production, d’ingestion et de transformation avec Apache Airflow, garantissant l’automatisation, la fiabilité et la traçabilité des traitements.- Optimisation de l’architecture PostgreSQL, déployée sur Kubernetes, pour assurer performance, scalabilité et robustesse.- Enrichissement, contrôle qualité et validation des données à différentes mailles via PostgreSQL et PySpark, renforçant la cohérence des jeux de données.- Sécurisation et automatisation des déploiements de pipelines (gestion des secrets, CI/CD, variables d’environnement), réduisant les risques de mise en production.- Encadrement technique et accompagnement de l’équipe sur les bonnes pratiques en Data Engineering et en orchestration.- Mise en place de tests automatisés et contrôles qualité, garantissant la fiabilité et la résilience des workflows.- Création d’un dashboard Metabase pour le suivi de la qualité des données et la diffusion d’indicateurs clés aux filiales.Résultat : Structuration d’une plateforme data robuste, capable de supporter des workflows critiques et des exigences fortes de qualité de données.
- MecanicusApplied Data Scientist / ML Engineer (GCP)AUTOMOBILENovember 2017 - September 2022 (4 years and 10 months)Paris, FranceEntreprise spécialisée dans l’achat-vente de véhicules premium, avec développement de solutions data et Machine Learning pour automatiser la collecte, l’analyse et la valorisation des données marché.- Développement d’une plateforme de collecte automatisée à grande échelle (scraping temps réel) sur Le Bon Coin, La Centrale et autres marketplaces, avec déploiement cloud sur Google Cloud Platform (Google Functions)- Conception d’un système de computer vision pour la détection de doublons et l’identification de véhicules similaires à partir des images (OpenCV, Pillow, Numpy).- Développement d’algorithmes de matching textuel et NLP pour rapprocher les annonces externes de la base de données interne.- Classification automatique de l’état visuel des véhicules via Vertex AI, pour enrichir les données utilisées par les modèles.- Exploration, entraînement et optimisation de modèles de Machine Learning de pricing (Scikit-learn, Pandas, Numpy) pour l’estimation automatisée de la valeur des véhicules.- Déploiement d’un modèle ML en production sur GCP, exposé pour automatiser la valorisation des véhicules à partir des données collectées.Résultat : industrialisation d’une chaîne complète de collecte, enrichissement et valorisation automatisée des données marché pour accélérer l’estimation des véhicules.
- ORANGESenior Data EngineerTELECOMMUNICATIONSMarch 2024 - November 2024 (8 months)Paris, FranceProjet de préparation et de valorisation des données marketing pour Orange (via Ekimetrics).- Développement d'un framework Python interne automatisant le téléchargement, la validation et l’intégration des données depuis un SFTP vers une landing zone Databricks.- Mise en place d’une architecture data en médaillon (bronze, silver, gold), pour structurer les pipelines ETL et fiabiliser les flux de données.- Déploiement et industrialisation d’un environnement DBT pour la gestion des transformations, les tests de qualité et le suivi du data lineage.- Formation et accompagnement de deux data analysts juniors sur les bonnes pratiques de Data Engineering et de Data Quality.- Création d’un dashboard Power BI pour le suivi de la qualité et la visibilité des jeux de données.Résultat : Amélioration de la fiabilité des pipelines marketing et réduction du temps de traitement des données.
Reviews
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Architecte en technologie numérique, Programmation / développeur informatique, général422022Architecte en technologie numérique, Programmation / développeur informatique, général
- Expert informatique et système d'information422021RNCP Niveau 7 validé en alternance.