You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Sidi C.SC

Sidi C.

Senior Data Engineer & AI Engineer | RAG | LLM

€750/day
Paris, FR
8-15 years

Average response time: 1 hour

About Sidi

Vous cherchez un expert pour concevoir et déployer une architecture RAG end-to-end en entreprise ? Construire des pipelines LLM robustes pour vos projets GenAI ? Intégrer l'IA générative à vos workflows métier ?
Avec près de 10 ans d'expérience en environnements exigeants (Sanofi, BNP Paribas CIB, Société Générale), j'interviens sur vos projets d'IA Générative et de Data Engineering, du cadrage à la mise en production.
🚀 Ce que j'apporte concrètement :

Actuellement chez Sanofi : Conception et développement de l'architecture RAG complète pour une plateforme GenAI pharmaceutique (parsing, chunking, embedding, vector store, retrieval, génération LLM). Azure OpenAI, AWS Bedrock, Pinecone, observabilité Weave/W&B.
IA Générative & RAG : Déploiement d'une plateforme RAG d'assistance documentaire chez BNP Paribas avec une réduction de 90% du temps de recherche. LangChain, LangGraph, Vector DB, FastAPI.
Data Engineering : Pipelines end-to-end AML & Fraud Detection traitant 50M+ transactions/jour. Spark, Kafka, Kubernetes, AWS.
Leadership technique : Constitution et management d'une équipe de 7+ personnes (Data Engineers, DevOps, BA). Code reviews, décisions architecturales, mentoring.
ML en production : Modèle de détection de fraude (GBM/H2O) déployé en production à la Société Générale.

📦 Stack technique : Python, LangChain, LangGraph, Azure OpenAI, AWS Bedrock, Pinecone, FAISS, S3 Vectors, Scala, Spark, Kafka, FastAPI, Kubernetes, Docker, Terraform, Databricks, Weave/W&B, Snowflake.
🎯 Secteurs : Pharma, Banque, Finance, Assurance | Disponible | Île-de-France & Remote
  • English

    Native or bilingual

  • French

    Native or bilingual

Can work on-site
Paris (up to 50km), Lyon (up to 50km), Lille (up to 50km), Nanterre (up to 50km), Bordeaux (up to 50km)

Experience

  • Sanofi Accelerator
    Sanofi - Data & AI Engineer
    PHARMACEUTICALS INDUSTRY
    April 2026 - Today (2 months)
    Paris, France
    Contexte :
    Plateforme GenAI pour la génération automatisée de documents réglementaires (Clinical Trial Documents) dans l'industrie pharmaceutique. Environnement de production critique avec exigences strictes de traçabilité, sécurité et conformité.
    Réalisations :

    Conception et développement de l'architecture RAG end-to-end : parsing de documents, chunking, embedding, vector store (Pinecone, S3 Vectors), retrieval et génération LLM
    Intégration de modèles LLM en production : Azure OpenAI (GPT-4o), AWS Bedrock (Claude)
    Architecture d'observabilité des pipelines LLM avec Weave/W&B : tracing step-by-step pour les équipes Data Science
    Optimisation des performances : remplacement FAISS par S3 Vectors pré-calculés, réduction des coûts de ~70%
    Refactoring de l'architecture backend vers DDD-light : résolution de 12 findings d'audit
    Rédaction de specs techniques (design doc 16 sections) alignant Data Science, Data Engineering et Backend
    Configuration multi-environnements (dev/test/prod) avec Pinecone et EventBridge

    Stack technique :
    Python 3.12 · FastAPI · AWS (Lambda, Step Functions, ECS, S3, Bedrock) · Azure OpenAI · LangChain · Pinecone · Weave/W&B · Terraform · Docker · GitHub Actions · Snowflake · NestJS · React · TypeScript
    Langchain Retrieval-Augmented Generation (RAG) Python AWS intelligence artificielle
  • BNP Paribas CIB
    Senior Data & AI Engineer
    BANKING AND INSURANCE
    May 2022 - February 2026 (3 years and 9 months)
    Pantin, France
    Intervention sur les projets Data Engineering et IA Générative de l'équipe IT Trade Finance, sur les périmètres AML (Anti-Money Laundering) et Fraud Detection.


    📊 Projet Data — Pipelines AML & Fraud Detection
    Développement de pipelines end-to-end traitant des millions de transactions : ETL, transformation, scoring et génération d'alertes.
    → Optimisation Spark (tuning avancé, gestion du data skew)
    → Intégration Quantexa pour graphes relationnels et enrichissement contextuel des alertes
    → Déploiement cloud privé avec Kubernetes, Skaffold, Kustomize

    👥 Mise en place et structuration d'une nouvelle équipe Data Engineering
    Pilotage de la création from scratch d'une équipe data de 7+ personnes : définition des besoins, recrutement, onboarding et montée en compétences.
    → Création et scaling d'une équipe offshore en Inde (4 Data Engineers, 1 DevOps, 1 BA, 1 PO)
    → Mise en place des standards de développement, patterns architecturaux et bonnes pratiques
    → Encadrement technique au quotidien : code reviews, décisions architecturales, mentoring

    🤖 Projet IA Générative — Plateforme RAG d'assistance documentaire
    Conception et déploiement d'une plateforme conversationnelle permettant d'interroger en langage naturel toute la documentation projet (Confluence, Jira, Elasticsearch, emails).
    → Réduction de 90% du temps de recherche d'information pour les équipes
    → Pipeline de vectorisation multi-sources, base de données vectorielle, orchestration LLM via LangChain avec prompt engineering et stratégies de retrieval optimisées
    → API backend Python/FastAPI, déploiement Kubernetes

    Stack : Python, LangChain, LangGraph, FastAPI, Elasticsearch, Vector DB, Scala, Spark, Kafka, Kubernetes, AWS, S3, Quantexa, ELK, RAG
    Spark RAG Langchain Scala Python
  • Bedrock streaming
    Senior Data engineer
    PRESS AND MEDIA
    January 2022 - May 2022 (4 months)
    Lyon, France
    Mission freelance au sein de l'équipe A/B Testing, sur les plateformes de streaming M6+, RTL+ Hungary et Videoland.

    📊 Pipelines Data multi-plateformes
    Conception et développement de pipelines temps réel et batch pour l'expérimentation et l'analytics sur plusieurs plateformes de streaming internationales.
    → Ingestion de volumes élevés d'événements utilisateur via AWS Glue, EMR et Athena
    → Workflows scalables avec Spark et Databricks pour fiabiliser les métriques d'expérimentation
    → Automatisation de l'infrastructure via Terraform et pipelines CI/CD (Jenkins, GitHub Actions)

    Stack : AWS (Glue, EMR, Athena), Terraform, Python, Scala, Spark, Databricks, Airflow, Docker, Jenkins, GitHub Actions, Iceberg, dbt
    Terraform Spark Python AWS Databricks

Recommendations

Olivier KanaOK
Santiago MosqueraSM
FU
Olivier Kana and 2 other people have recommended Sidi

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master informatique
    Sorbonne université (ex Université Pierre et Marie Curie)
    2018

Certifications

Skill set

Categories