About Michaël
Résumé
- La détection de fraudes e-commerce (xgboost, feature engineering, MLOps, AWS, Kubernetes)
- Le déploiement de modèles NLP à l'état de l'art pour la détection de secrets dans des fichiers de code source (Transformers, Pytorch, FastAPI, ONNX Runtime, Kubernetes AWS EKS)
- Le développement d'un module Terraform complet pour une pipeline de traitement de données non structurées: Transformer des fichiers PDF, PPTX, DOCX en vecteurs dans Pinecone (LLMs, modèles multi-modaux / VLMs, OCR, Terraform, AWS, Weight's and Biases Weave)
- Entraînement et fine-tuning de modèles ML classiques et LLMs / VLMs
- Agents
- LLM FinOps : évaluation coût/performance (OpenAI, Bedrock, Benchmarks…)
- Déploiement de services IA : microservices, APIs, batch jobs
- Mise en place de bonnes pratiques MLOps : reproductibilité, versioning (DVC), CI/CD, Docker, suivi d’expériences, scalabilité
- Software Engineering : PEP8, code propre, documenté et modulaire, gestion des erreurs, monitoring
- Multi-cloud : AWS, Kubernetes
- IaC: Terraform
- Orchestration avec Dagster, Airflow
- Développement de pipelines ETL / ELT (pyspark, snowpark)
- Snowflake, Hadoop, PostgreSQL
Stack
French
Native or bilingual
English
Native or bilingual
Spanish
Conversational
Experience
- SanofiMLOps Engineer - GenAI Platform team - Sanofi AcceleratorHEALTH AND WELLNESSDecember 2024 - Today (1 year and 6 months)Paris, France• Implémentation d’une Pipeline de Données Non Structurées (UDP) avec Terraform, AWS Textract et des LLM multimodaux (Claude 3.7, GPT-4o…) pour traiter des fichiers PDF, DOCX, PPTX,...• Structuration de l’UDP en étapes modulaires : parsing de documents (OCR + VLM), extraction de metadata (LLM comme Amazon Nova Lite), chunking, puis vectorisation vers Pinecone pour les cas d’usage RAG.• Packaging de l’UDP sous forme de module Terraform, permettant des déploiements spécifiques par équipe sans friction de gouvernance des données.• Conception de solutions hybrides OCR + VLM pour le parsing de documents complexes, optimisées pour la précision, le coût et le throughput.• Développement d'un benchmark interne avec DVC & Weave pour comparer les bibliothèques open source et les VLM sur l’extraction de données structurées.• Containerisation de fonctions Lambda afin de supporter certaines libraires (python-docx, Weave) tout en respectant les contraintes AWS.• Déploiement de Weights & Biases Weave dans plusieurs équipes afin de standardiser le monitoring et l’évaluation des LLM (LLM-as-a-Judge, leaderboards, tutoriels, support).
- GitGuardianMACHINE LEARNING ENGINEERTECHOctober 2023 - Today (2 years and 8 months)Paris, France- Création de la stack MLOps avec GitLab CI, SkyPilot, DVC, ONNX Runtime, BentoML, Helm, ArgoCD and Dagster.- Fine-tuning et intégration de modèles NLP dans le moteur de détection de secrets GitGuardian, réduisant le nombre de Faux Positifs par 5.- Développement d’un PoC pour la remédiation automatique de fuite de secrets en utilisant des parsers AST et OpenAI API, mise en production prévue pour Q1 2025.
- Ubisoft InternationalMACHINE LEARNING ENGINEERVIDEO GAMES AND ANIMATIONFebruary 2021 - October 2023 (2 years and 8 months)Paris, France- Optimisation des modèles (xgboost, fp-growth, feature engineering, semi-supervised learning) pour la détection de fraudes dans le e-commerce Ubisoft, menant à 5% d’économies dans les ventes Ubisoft, donc 4M€ annuel.- Partage des bonnes pratiques MLOps aux équipes Data à Ubisoft (DVC, ClearML, K8s training jobs, AWS)- Collaboration avec les Data Engineers sur l’intégration de nouvelles sources de données pour nos modèles : Spark, Hadoop, Airflow
Reviews
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Ingénieur - Data ScienceISAE-Supaero2020Spécialisation Data Science 2 stages en césure Semestre à Singapour