Description

Vous cherchez un expert pour concevoir et déployer une architecture RAG end-to-end en entreprise ? Construire des pipelines LLM robustes pour vos projets GenAI ? Intégrer l'IA générative à vos workflows métier ?

Avec près de 10 ans d'expérience en environnements exigeants (Sanofi, BNP Paribas CIB, Société Générale), j'interviens sur vos projets d'IA Générative et de Data Engineering, du cadrage à la mise en production.

🚀 Ce que j'apporte concrètement :

Actuellement chez Sanofi : Conception et développement de l'architecture RAG complète pour une plateforme GenAI pharmaceutique (parsing, chunking, embedding, vector store, retrieval, génération LLM). Azure OpenAI, AWS Bedrock, Pinecone, observabilité Weave/W&B.

IA Générative & RAG : Déploiement d'une plateforme RAG d'assistance documentaire chez BNP Paribas avec une réduction de 90% du temps de recherche. LangChain, LangGraph, Vector DB, FastAPI.

Data Engineering : Pipelines end-to-end AML & Fraud Detection traitant 50M+ transactions/jour. Spark, Kafka, Kubernetes, AWS.

Leadership technique : Constitution et management d'une équipe de 7+ personnes (Data Engineers, DevOps, BA). Code reviews, décisions architecturales, mentoring.

ML en production : Modèle de détection de fraude (GBM/H2O) déployé en production à la Société Générale.

📦 Stack technique : Python, LangChain, LangGraph, Azure OpenAI, AWS Bedrock, Pinecone, FAISS, S3 Vectors, Scala, Spark, Kafka, FastAPI, Kubernetes, Docker, Terraform, Databricks, Weave/W&B, Snowflake. Forward Deployed Engineer, GenAI, FDE, API Integration, Python, Backend Development, LLM Orchestration

🎯 Secteurs : Pharma, Banque, Finance, Assurance | Disponible | Île-de-France & Remote

Industry field of expertise

Languages

English
Native or bilingual
French
Native or bilingual

Workplace preferences

Can work on-site

Paris (up to 50km), Lyon (up to 50km), Lille (up to 50km), Nanterre (up to 50km), Bordeaux (up to 50km)

Sanofi Accelerator
Sanofi - Data & AI Engineer
PHARMACEUTICALS INDUSTRY
April 2026 - Today (3 months)
Paris, France
Contexte :
Plateforme GenAI pour la génération automatisée de documents réglementaires (Clinical Trial Documents) dans l'industrie pharmaceutique. Environnement de production critique avec exigences strictes de traçabilité, sécurité et conformité.
Réalisations :

Conception et développement de l'architecture RAG end-to-end : parsing de documents, chunking, embedding, vector store (Pinecone, S3 Vectors), retrieval et génération LLM
Intégration de modèles LLM en production : Azure OpenAI (GPT-4o), AWS Bedrock (Claude)
Architecture d'observabilité des pipelines LLM avec Weave/W&B : tracing step-by-step pour les équipes Data Science
Optimisation des performances : remplacement FAISS par S3 Vectors pré-calculés, réduction des coûts de ~70%
Refactoring de l'architecture backend vers DDD-light : résolution de 12 findings d'audit
Rédaction de specs techniques (design doc 16 sections) alignant Data Science, Data Engineering et Backend
Configuration multi-environnements (dev/test/prod) avec Pinecone et EventBridge

Stack technique :
Python 3.12 · FastAPI · AWS (Lambda, Step Functions, ECS, S3, Bedrock) · Azure OpenAI · LangChain · Pinecone · Weave/W&B · Terraform · Docker · GitHub Actions · Snowflake ·Forward Deployed Engineer, GenAI, FDE, API Integration, Python, Backend Development, LLM Orchestration, NestJS · React · TypeScript
Langchain Retrieval-Augmented Generation (RAG) Python AWS intelligence artificielle
BNP Paribas CIB
Senior Data & AI Engineer
BANKING AND INSURANCE
May 2022 - February 2026 (3 years and 9 months)
Pantin, France
Intervention sur les projets Data Engineering et IA Générative de l'équipe IT Trade Finance, sur les périmètres AML (Anti-Money Laundering) et Fraud Detection.

📊 Projet Data — Pipelines AML & Fraud Detection
Développement de pipelines end-to-end traitant des millions de transactions : ETL, transformation, scoring et génération d'alertes.
→ Optimisation Spark (tuning avancé, gestion du data skew)
→ Intégration Quantexa pour graphes relationnels et enrichissement contextuel des alertes
→ Déploiement cloud privé avec Kubernetes, Skaffold, Kustomize

👥 Mise en place et structuration d'une nouvelle équipe Data Engineering
Pilotage de la création from scratch d'une équipe data de 7+ personnes : définition des besoins, recrutement, onboarding et montée en compétences.
→ Création et scaling d'une équipe offshore en Inde (4 Data Engineers, 1 DevOps, 1 BA, 1 PO)
→ Mise en place des standards de développement, patterns architecturaux et bonnes pratiques
→ Encadrement technique au quotidien : code reviews, décisions architecturales, mentoring

🤖 Projet IA Générative — Plateforme RAG d'assistance documentaire
Conception et déploiement d'une plateforme conversationnelle permettant d'interroger en langage naturel toute la documentation projet (Confluence, Jira, Elasticsearch, emails).
→ Réduction de 90% du temps de recherche d'information pour les équipes
→ Pipeline de vectorisation multi-sources, base de données vectorielle, orchestration LLM via LangChain avec prompt engineering et stratégies de retrieval optimisées
→ API backend Python/FastAPI, déploiement Kubernetes

Stack : Python, LangChain, LangGraph, FastAPI, Elasticsearch, Vector DB, Scala, Spark, Kafka, Kubernetes, AWS, S3, Quantexa, ELK, RAG
Spark RAG Langchain Scala Python
Bedrock streaming
Senior Data engineer
PRESS AND MEDIA
January 2022 - May 2022 (4 months)
Lyon, France
Mission freelance au sein de l'équipe A/B Testing, sur les plateformes de streaming M6+, RTL+ Hungary et Videoland.

📊 Pipelines Data multi-plateformes
Conception et développement de pipelines temps réel et batch pour l'expérimentation et l'analytics sur plusieurs plateformes de streaming internationales.
→ Ingestion de volumes élevés d'événements utilisateur via AWS Glue, EMR et Athena
→ Workflows scalables avec Spark et Databricks pour fiabiliser les métriques d'expérimentation
→ Automatisation de l'infrastructure via Terraform et pipelines CI/CD (Jenkins, GitHub Actions)

Stack : AWS (Glue, EMR, Athena), Terraform, Python, Scala, Spark, Databricks, Airflow, Docker, Jenkins, GitHub Actions, Iceberg, dbt
Terraform Spark Python AWS Databricks