You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Aymeric GuillochetAG

Aymeric Guillochet

Data Engineer & MLOps | Pipelines & ML

€600/day
6 projects
Paris, FR
3-7 years

Average response time: 1 hour

About Aymeric

Data Engineer & MLOps | Airflow, Python | Pipelines & ML en production (GCP, Azure)

Vous avez des pipelines fragiles ? Des modèles ML difficiles à maintenir ou à déployer dans le cloud
J’aide les équipes data à industrialiser, automatiser et fiabiliser leurs systèmes sur GCP et Azure.

Je suis Data Engineer & Data Scientist, spécialisé en Python, SQL, ETL et Machine Learning.

J’interviens sur tout le cycle de vie des données - de leur ingestion à leur mise en production - pour construire des solutions scalables, fiables et surtout orientées métier.
J’interviens sur des problématiques de mise en production où :
  • les pipelines sont instables ou difficiles à maintenir
  • les données manquent de fiabilité
  • les modèles ML restent au stade de POC
🚀 Quelques exemples concrets :

  • Action Logement : industrialisation d’un pipeline qualité sur 1M+ logements
  • Mecanicus : déploiement de modèles ML (computer vision, NLP, pricing) sur GCP avec API
  • Orange / Ekimetrics : conception de pipelines cloud Azure & GCP pour ingestion et transformation de données

Cette diversité me permet de couvrir tout le cycle de vie de la donnée, du modèle ML jusqu’à son industrialisation.


🛠️ Ce que je fais concrètement
  • Conception de pipelines data robustes (Airflow, DBT, Python)
  • Industrialisation de modèles ML (batch / pipelines orchestrés)
  • Déploiement et exploitation sur cloud (GCP, Azure)
  • Fiabilisation des traitements (monitoring, gestion des erreurs, reprise)
  • Mise en place de CI/CD data & ML
  • Optimisation des performances et des coûts

💡 Je transforme vos POC en systèmes robustes : pipelines & ML fiables, scalables et monitorés.
Expertise end-to-end, de la data brute à la production sur GCP & Azure.
  • French

    Native or bilingual

  • English

    Conversational

Can work on-site
Paris (up to 30km), Brunoy (up to 30km)

Experience

  • Action Logement Services
    Lead Data Engineer | Airflow / Data Platform
    REAL ESTATE
    December 2024 - Today (1 year and 7 months)
    Paris, France
    Projet stratégique de structuration et d’orchestration de pipelines data pour le DataHub Action Logement.

    - Conception et orchestration de workflows data de production, d’ingestion et de transformation avec Apache Airflow, garantissant l’automatisation, la fiabilité et la traçabilité des traitements.

    - Optimisation de l’architecture PostgreSQL, déployée sur Kubernetes, pour assurer performance, scalabilité et robustesse.

    - Enrichissement, contrôle qualité et validation des données à différentes mailles via PostgreSQL et PySpark, renforçant la cohérence des jeux de données.

    - Sécurisation et automatisation des déploiements de pipelines (gestion des secrets, CI/CD, variables d’environnement), réduisant les risques de mise en production.

    - Encadrement technique et accompagnement de l’équipe sur les bonnes pratiques en Data Engineering et en orchestration.

    - Mise en place de tests automatisés et contrôles qualité, garantissant la fiabilité et la résilience des workflows.

    - Création d’un dashboard Metabase pour le suivi de la qualité des données et la diffusion d’indicateurs clés aux filiales.

    Résultat : Structuration d’une plateforme data robuste, capable de supporter des workflows critiques et des exigences fortes de qualité de données.
    Apache Airflow PySpark Postresql CI/CD Kubernetes
  • Mecanicus
    Applied Data Scientist / ML Engineer (GCP)
    AUTOMOBILE
    November 2017 - September 2022 (4 years and 10 months)
    Paris, France
    Entreprise spécialisée dans l’achat-vente de véhicules premium, avec développement de solutions data et Machine Learning pour automatiser la collecte, l’analyse et la valorisation des données marché.

    - Développement d’une plateforme de collecte automatisée à grande échelle (scraping temps réel) sur Le Bon Coin, La Centrale et autres marketplaces, avec déploiement cloud sur Google Cloud Platform (Google Functions)

    - Conception d’un système de computer vision pour la détection de doublons et l’identification de véhicules similaires à partir des images (OpenCV, Pillow, Numpy).

    - Développement d’algorithmes de matching textuel et NLP pour rapprocher les annonces externes de la base de données interne.

    - Classification automatique de l’état visuel des véhicules via Vertex AI, pour enrichir les données utilisées par les modèles.

    - Exploration, entraînement et optimisation de modèles de Machine Learning de pricing (Scikit-learn, Pandas, Numpy) pour l’estimation automatisée de la valeur des véhicules.

    - Déploiement d’un modèle ML en production sur GCP, exposé pour automatiser la valorisation des véhicules à partir des données collectées.

    Résultat : industrialisation d’une chaîne complète de collecte, enrichissement et valorisation automatisée des données marché pour accélérer l’estimation des véhicules.
    Machine learning Google cloud Vertex AI Computer Vision NLP
  • ORANGE
    Senior Data Engineer
    TELECOMMUNICATIONS
    March 2024 - November 2024 (8 months)
    Paris, France
    Projet de préparation et de valorisation des données marketing pour Orange (via Ekimetrics).

    - Développement d'un framework Python interne automatisant le téléchargement, la validation et l’intégration des données depuis un SFTP vers une landing zone Databricks.

    - Mise en place d’une architecture data en médaillon (bronze, silver, gold), pour structurer les pipelines ETL et fiabiliser les flux de données.

    - Déploiement et industrialisation d’un environnement DBT pour la gestion des transformations, les tests de qualité et le suivi du data lineage.

    - Formation et accompagnement de deux data analysts juniors sur les bonnes pratiques de Data Engineering et de Data Quality.

    - Création d’un dashboard Power BI pour le suivi de la qualité et la visibilité des jeux de données.

    Résultat : Amélioration de la fiabilité des pipelines marketing et réduction du temps de traitement des données.
    Databricks Python Data Quality Data Engineer DBT

Reviews

5,0

Out of 3 ratings

QuentinQ

Quentin

MECANICUS

Reviewed on 17/04/2023

Super Profil compétent, sympa, malin, cela fait des années que je travaille avec Aymeric, je le recommande vraiment chaudement, et a disposition pour tout background check.
R

Ruben

DITESCO SAS

Reviewed on 19/11/2022

Top, Aymerick est ponctuel, parfaitement qualifié pour notre mission. Je recommande.

Recommendations

Shahzad AkbarSA
Paul C.PC
Sophie CarboniSC
Shahzad Akbar and 2 other people have recommended Aymeric

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Architecte en technologie numérique, Programmation / développeur informatique, général
    42
    2022
    Architecte en technologie numérique, Programmation / développeur informatique, général
  • Expert informatique et système d'information
    42
    2021
    RNCP Niveau 7 validé en alternance.

Skill set

Categories