You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Bakary S.BS

Bakary S.

AI/ML Engineer & MLOps Specialist

€600/day
Choisy-le-Roi, FR
3-7 years

Average response time: 1 hour

About Bakary

Senior LLMOps & MLOps Engineer (5+ ans) – Spécialisé en systèmes RAG et IA générative en production (AWS, GCP)

Je conçois et déploie des systèmes d’IA en production (RAG, LLMs, ML) pour des cas d’usage critiques, avec un focus sur la performance, la scalabilité et l’optimisation des coûts.

Expertise principale :
• Architecture RAG production-ready (hybrid search, reranking, vector DB : Qdrant, Pinecone)
• Industrialisation LLM (vLLM, déploiement GPU, APIs scalables)
• MLOps end-to-end (CI/CD, orchestration Prefect/Airflow, monitoring & drift)

Impact :
• Amélioration de la précision des systèmes de recherche sémantique
• Réduction de la latence et des coûts d’inférence LLM
• Mise en production de pipelines ML robustes et automatisés

Stack :
LLMOps : LangChain, LangGraph, vLLM, Hugging Face
Vector DB : Qdrant, Pinecone, FAISS
Cloud : AWS (SageMaker, S3, Lambda), GCP (Vertex AI)
Data/ML : PyTorch, XGBoost, PySpark

Disponible pour missions :
• RAG / IA générative
• MLOps / industrialisation ML
• Optimisation de systèmes LLM en production
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Choisy-le-Roi (up to 50km)

Experience

  • Base Claude Bernard
    Lead Data & IA
    October 2025 - Today (8 months)
    Île-de-France, France
    • Conception et déploiement d’un système RAG médical en production (880k+ documents), améliorant la précision des réponses et garantissant la traçabilité (citations sourcées)

    • Mise en place d’un pipeline de retrieval multi-étapes :
    - Validation des requêtes via LLM (filtrage médical)
    - Expansion multi-requêtes (couverture sémantique)
    - Recherche hybride (Qdrant : dense BGE-M3 + sparse Splade + fusion)
    - Reranking via cross-encoder pour haute précision clinique

    • Industrialisation des LLM :
    - Déploiement vLLM (API OpenAI-like) sur GPU (RunAI)
    - Traitement asynchrone (Celery/Redis) → réduction de la latence

    • Mise en place d’une stack LLMOps en production :
    - CI/CD GitLab, conteneurisation Docker, monitoring
    - Fiabilité, reproductibilité et optimisation des coûts

    • Développement de pipelines data incrémentaux (Prefect) :
    - Ingestion multi-sources (ANSM, HAS…)
    - Versioning intelligent (hash) → réduction des recalculs

    Stack : Qdrant, vLLM, LangChain, Prefect, FastAPI, Docker, GitLab CI/CD, PostgreSQL
  • Lisi
    Data & MLOps Engineer
    CONSULTING AND AUDITS
    November 2022 - Today (3 years and 7 months)
    Paris, France
    • • Développement de pipelines MLOps end-to-end sur AWS SageMaker :
    - CI/CD GitLab, déploiement automatisé, model registry
    - Monitoring du drift avec alertes → amélioration de la robustesse

    • Conception de pipelines data scalables :
    - ETL (AWS Glue, PySpark), orchestration (Airflow)
    - Data Lake S3 + analytics (Athena)

    • Développement d’APIs et sécurisation des accès :
    - AWS Lambda + API Gateway
    - Gestion des utilisateurs via Cognito

    • Mise en place d’un système RAG industriel :
    - Recherche sémantique sur documentation technique
    - Observabilité (LangSmith) : latence, coûts, hallucinations

    Stack : AWS (SageMaker, Glue, Airflow, Lambda, S3), LangChain, OpenSearch, PySpark
    Cloud AWS MLOps / Machine Learning Engineering AWS SageMaker GenAI RAG
  • TradeIn
    Data Scientist
    April 2021 - October 2022 (1 year and 6 months)
    Paris, France
    ️ Stack : AWS (S3, Textract, QuickSight, SageMaker, Lambda, Athena), Airflow, FastAPI, XGBoost, PostgreSQL, PySpark

Recommendations

Be the first to recommend Bakary

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master of Science
    École Polytechnique
    2020
    Master 2, Data Science
  • Master 2 (M2), Multimedia Networking
    Télécom ParisTech
    2019
    Master 2 (M2), Multimedia Networking

Certifications

Skill set (20)

Categories