Description

Data Scientist – Spécialiste NLP et IA Gen

Data Scientist avec 4 ans d’expérience, je conçois et déploie des solutions d’intelligence artificielle adaptées aux besoins des entreprises. Mon expertise couvre le NLP, les modèles génératifs et l’automatisation des processus métiers.

Services proposés :

🔹 Développement de chatbots et agents IA : Automatisation des interactions clients et internes avec des modèles avancés (RAG, LLM)

🔹 Recherche sémantique et NLP : Mise en place de moteurs de recherche intelligents pour une meilleure compréhension et structuration des données textuelles

🔹 Extraction et analyse de documents : Structuration et exploitation de données issues de documents (PDF, emails, bases de données)

🔹 IA générative : Intégration de modèles comme GPT et BERT pour la génération automatique de contenu

🔹 Automatisation des workflows : Développement de pipelines IA et Data pour optimiser les processus métiers

Pourquoi travailler ensemble ?

✔ Expertise technique : Expérience confirmée sur des projets NLP, IA générative et automatisation

✔ Solutions sur mesure : Adaptation aux besoins spécifiques et déploiement en production

✔ Maîtrise des outils clés : Python, LangChain, Hugging Face, ElasticSearch, CamemBERT, Docker, Streamlit, FastAPI, Spark, Azure...

Je suis disponible pour échanger sur vos projets et vous proposer des solutions adaptées. N’hésitez pas à me contacter.

Industry field of expertise

Languages

French
Native or bilingual
English
Fluent

Workplace preferences

Can work on-site

Paris (up to 50km)

Caisse des Dépôts et Consignations
Data Scientist - Engineer
PUBLIC SECTOR
March 2024 - Today (2 years and 4 months)
Paris, France
- Développement d'un algorithme IA pour identifier des certifications en lien avec la transition écologique, avec une précision de classification de 80% (Embedding CamemBERT + Cosine Similarity & Fine-tuning CamemBERT)

- Clustering sémantique de 25 000 certifications pour l'indexation documentaire (Cosine Similarity + algorithme Find-Union)

- Développement d'un moteur sémantique de recherche de fichiers sur le OneDrive du service data (Langchain, Faiss, Camembert, Streamlit)

- Conception et déploiement d'une API de vectorisation de documents textuels (hugging face, Camembert, onnx runtime, FastAPI)

- Conception et optimisation des pipelines de données via Alteryx et PySpark : fourniture automatique de données en réponse aux demandes métiers

- Référent technique OpenData : création, publication et maintenance des pipelines d'alimentation des jeux de données

- Conduite d'ateliers de restitution des projets aux équipes métiers
Python MySQL Alteryx Hugging Face FastAPI OpenDataSoft ONNX Langchain FAISS Elasticsearch Streamlit
Île-De-France-Mobilités
Data Scientist
TRANSPORTATION
October 2022 - March 2024 (1 year and 5 months)
Paris, France
- Conception et déploiement d'un RAG sur les spécifications fonctionnelles & techniques de l'équipe IVTR

- Conception et déploiement d'un Agent IA (interface avec GPT-4) afin de simuler des données de transport pour tests

- Création d'une webApp Flask de génération des flux de données (interface de chat)
• Déploiement de la webApp sur Azure (App Services, Azure Functions) et mise en place d'une CI/CD

- Automatisation des tests de non-régression, réduisant le temps d'exécution manuelle de 5 jours à 3 heures, soit un gain de productivité de 90%

- Conduite des tests de non-régression de l'application de recherche d'itinéraire d'IDFM, optimisée pour les JO Paris 2024

- Rédaction des spécifications, gestion des anomalies et suivi technique du relais IVTR

- Animation des instances agiles et coordination des tests de connexion de nouveaux partenaires
Python Node.js MySQL Langchain Elasticsearch Kibana GPT4 Azure DevOps Docker Postman Chroma DB flask
PwC France
Data Scientist NLP
CONSULTING AND AUDITS
October 2021 - August 2022 (10 months)
Paris, France
- Entraînement et déploiement en production de huit modèles de classification de mails sur Databricks via MLflow (mise en concurrence des modèles CamemBERT, SVM et Perceptron)

- Conception et mise en œuvre d'une pipeline MLOps robuste, intégrant une boucle rétroactive pour l'évaluation continue et la détection du data drift

- Création d'un robot sous UiPath interfaçant le modèle de classification de mails et la boucle de rétroaction, automatisant la classification des mails dans la boîte de
réception client

- Développement d'un système de recommandation d'archivage performant permettant d'identifier et d'éliminer les documents obsolètes, entraînant une réduction de 20% de l'espace de stockage utilisé

- Collaboration avec les équipes de développement et gestionnaires de projets pour l'alignement des solutions avec les besoins clients.
Python keras BERT Scikit-learn UiPath Microsoft Power BI Databricks MLflow

Check out Haboubacar's experience

Be the first to recommend Haboubacar

Help this freelancer shine by sharing your experience working together.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Diplôme d'ingénieur, Intelligence Artificielle
CY Tech
2022
Statistiques - Machine learning - Deep learning - Deep learning - NLP
CPGE MPSI-MP
CPGE Lycée Moulay Idriss(Fès-Maroc)
2019
CPGE option Maths-Physique

Check out Haboubacar's education

AI engineer

Haboubacar T.

AI Engineer (Agentic System - Document AI)

About Haboubacar

Data Scientist – Spécialiste NLP et IA Gen

Experience

Recommendations

These freelancer profiles also match your criteria

Education

Skill set

Categories