You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Haboubacar T.HT

Haboubacar T.

AI Engineer (Agentic System - Document AI)

€600/day
Paris, FR
3-7 years

Average response time: 1 hour

About Haboubacar

Data Scientist – Spécialiste NLP et IA Gen

Data Scientist avec 4 ans d’expérience, je conçois et déploie des solutions d’intelligence artificielle adaptées aux besoins des entreprises. Mon expertise couvre le NLP, les modèles génératifs et l’automatisation des processus métiers.

Services proposés :
🔹 Développement de chatbots et agents IA : Automatisation des interactions clients et internes avec des modèles avancés (RAG, LLM)

🔹 Recherche sémantique et NLP : Mise en place de moteurs de recherche intelligents pour une meilleure compréhension et structuration des données textuelles

🔹 Extraction et analyse de documents : Structuration et exploitation de données issues de documents (PDF, emails, bases de données)

🔹 IA générative : Intégration de modèles comme GPT et BERT pour la génération automatique de contenu

🔹 Automatisation des workflows : Développement de pipelines IA et Data pour optimiser les processus métiers

Pourquoi travailler ensemble ?
✔ Expertise technique : Expérience confirmée sur des projets NLP, IA générative et automatisation

✔ Solutions sur mesure : Adaptation aux besoins spécifiques et déploiement en production

✔ Maîtrise des outils clés : Python, LangChain, Hugging Face, ElasticSearch, CamemBERT, Docker, Streamlit, FastAPI, Spark, Azure...

Je suis disponible pour échanger sur vos projets et vous proposer des solutions adaptées. N’hésitez pas à me contacter.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • Caisse des Dépôts et Consignations
    Data Scientist - Engineer
    PUBLIC SECTOR
    March 2024 - Today (2 years and 3 months)
    Paris, France
    - Développement d'un algorithme IA pour identifier des certifications en lien avec la transition écologique, avec une précision de classification de 80% (Embedding CamemBERT + Cosine Similarity & Fine-tuning CamemBERT)

    - Clustering sémantique de 25 000 certifications pour l'indexation documentaire (Cosine Similarity + algorithme Find-Union)

    - Développement d'un moteur sémantique de recherche de fichiers sur le OneDrive du service data (Langchain, Faiss, Camembert, Streamlit)

    - Conception et déploiement d'une API de vectorisation de documents textuels (hugging face, Camembert, onnx runtime, FastAPI)

    - Conception et optimisation des pipelines de données via Alteryx et PySpark : fourniture automatique de données en réponse aux demandes métiers

    - Référent technique OpenData : création, publication et maintenance des pipelines d'alimentation des jeux de données

    - Conduite d'ateliers de restitution des projets aux équipes métiers
    Python MySQL Alteryx Hugging Face FastAPI OpenDataSoft ONNX Langchain FAISS Elasticsearch Streamlit
  • Île-De-France-Mobilités
    Data Scientist
    TRANSPORTATION
    October 2022 - March 2024 (1 year and 5 months)
    Paris, France
    - Conception et déploiement d'un RAG sur les spécifications fonctionnelles & techniques de l'équipe IVTR

    - Conception et déploiement d'un Agent IA (interface avec GPT-4) afin de simuler des données de transport pour tests

    - Création d'une webApp Flask de génération des flux de données (interface de chat)
    • Déploiement de la webApp sur Azure (App Services, Azure Functions) et mise en place d'une CI/CD

    - Automatisation des tests de non-régression, réduisant le temps d'exécution manuelle de 5 jours à 3 heures, soit un gain de productivité de 90%

    - Conduite des tests de non-régression de l'application de recherche d'itinéraire d'IDFM, optimisée pour les JO Paris 2024

    - Rédaction des spécifications, gestion des anomalies et suivi technique du relais IVTR

    - Animation des instances agiles et coordination des tests de connexion de nouveaux partenaires
    Python Node.js MySQL Langchain Elasticsearch Kibana GPT4 Azure DevOps Docker Postman Chroma DB flask
  • PwC France
    Data Scientist NLP
    CONSULTING AND AUDITS
    October 2021 - August 2022 (10 months)
    Paris, France
    - Entraînement et déploiement en production de huit modèles de classification de mails sur Databricks via MLflow (mise en concurrence des modèles CamemBERT, SVM et Perceptron)

    - Conception et mise en œuvre d'une pipeline MLOps robuste, intégrant une boucle rétroactive pour l'évaluation continue et la détection du data drift

    - Création d'un robot sous UiPath interfaçant le modèle de classification de mails et la boucle de rétroaction, automatisant la classification des mails dans la boîte de
    réception client

    - Développement d'un système de recommandation d'archivage performant permettant d'identifier et d'éliminer les documents obsolètes, entraînant une réduction de 20% de l'espace de stockage utilisé

    - Collaboration avec les équipes de développement et gestionnaires de projets pour l'alignement des solutions avec les besoins clients.
    Python keras BERT Scikit-learn UiPath Microsoft Power BI Databricks MLflow

Recommendations

Be the first to recommend Haboubacar

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Diplôme d'ingénieur, Intelligence Artificielle
    CY Tech
    2022
    Statistiques - Machine learning - Deep learning - Deep learning - NLP
  • CPGE MPSI-MP
    CPGE Lycée Moulay Idriss(Fès-Maroc)
    2019
    CPGE option Maths-Physique

Skill set

Categories