You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Raphael BensamounRB

Raphael Bensamoun

Data Scientist | NLP | AI & RAG Engineer

€600/day
Paris, FR
8-15 years

Average response time: 1 hour

About Raphael

Vos données valent bien plus que ce que vous en faites aujourd'hui !

Fort de près de 10 années d'expérience, j'accompagne les équipes data, marketing et métier dans la construction de modèles prédictifs, leur industrialisation et l'exploitation concrète de leurs données.

J'ai eu la chance d'accompagner aussi bien des grands groupes (LVMH, Clarins, TF1, Fnac-Darty, HP, Janssen, TotalEnergies) que des PME et ETI en forte croissance.

🎯 DOMAINES D'EXPERTISE

📊 Analyse Exploratoire, Visualisation & Dashboarding
🧠 Data Science, Machine Learning & NLP
🤖 IA Générative
⚙️ Automatisation (RPA, workflows, document engineering)
🌐 Développement d'Applications Web

🛠️ STACK TECHNIQUE

📚 Machine Learning & NLP
  • Clustering et classification
  • Détection de sujets (topic modeling)
  • Analyse de sentiments
  • Prédiction de séries temporelles
  • Moteurs de recommandation
  • Détection d'anomalies
💻 Programmation
  • Python, Scala, PySpark, SQL, R
📦 Data Science & Librairies
  • Manipulation de données : Pandas, NumPy
  • Machine Learning : Scikit-Learn, XGBoost, LightGBM, MLLib
  • Deep Learning : Keras, PyTorch, TensorFlow
  • Graphes : NetworkX
🤖 IA Générative
  • Bases de données vectorielles : PostgreSQL (pgvector), Pinecone, Haystack
  • Frameworks : LangChain, LlamaIndex
  • API LLM : Claude (Anthropic), OpenAI, Cohere, Mistral, OVHcloud AI
☁️ Cloud
  • Google Cloud Platform : BigQuery, Vertex AI, Cloud Functions, Cloud Run
  • Azure : Azure ML, Azure Functions
🗄️ Bases de Données
  • Relationnelles : MySQL, PostgreSQL, SQLite, Hive
  • NoSQL : MongoDB
  • Graphes : Neo4j, Gremlin
📊 Visualisation
  • Plotly, Matplotlib, Seaborn, Tableau, Apache Superset
🕷️ Scraping & Collecte de Données
  • Requests, Selenium, BeautifulSoup, Scrapy
🌐 Développement Web & Prototypage
  • Front-end : React, HTML, CSS
  • Back-end / APIs : FastAPI, Flask
  • Reflex, Streamlit, Dash
🔧 DevOps & MLOps
  • Git, Docker, CI/CD
  • MLflow, monitoring de modèles
  • French

    Native or bilingual

  • English

    Native or bilingual

  • Spanish

    Fluent

Can work on-site
Paris (up to 50km), Lille (up to 50km), Bordeaux (up to 50km), Strasbourg (up to 50km), Marseille (up to 50km)

Experience

  • TotalEnergies
    Lead Data Scientist
    ENERGY AND UTILITIES
    January 2023 - Today (3 years and 6 months)
    Paris, France
    Prédiction des ventes :
    Développé et déployé un modèle de prédiction (N-HiTS) sur GCP, améliorant la précision des forecasts de ~50%. Pipeline automatisé et interface de visualisation pour les équipes métier.

    Clustering sémantique SEO :
    Créé un algorithme regroupant +700k impressions Google par intention de recherche, permettant aux équipes SEO d'optimiser leur stratégie de contenu. Déployé via Streamlit sur GCP.

    Monitoring des commentaires clients :
    Mis en place un outil de topic modeling (BERTopic) analysant +10k commentaires pour identifier les tendances. Classification automatisée des nouveaux commentaires par proximité sémantique, avec labélisation par LLM (Gemini). Dashboard interactif pour le suivi.

    Génération d'assets digitaux :
    Développé une application web de création de visuels intégrant la génération d'images par IA (Gemini, Imagen) et un éditeur visuel. Temps de production réduit de plusieurs jours vs agence.
    Google Cloud Platform (GCP) Python Clustering Développement Front-End Time Series
  • Johnson & Johnson
    Customer Engagement Analytics Manager
    PHARMACEUTICALS INDUSTRY
    January 2022 - December 2022 (1 year)
    Paris, France
    Pilotage de l'adoption d'une plateforme de recommandation omnicanale
    Interface entre équipes business et techniques pour aligner besoins métier et développements produit.
    Accompagné 6 équipes dans le déploiement. Produit des rapports d'analytics identifiant les leviers d'engagement et augmentant l'adoption de la plateforme.
    Python Gestion de projet Plotly Dash
  • Hewlett Packard Enterprise (HPE)
    Data Engineer
    SOFTWARE PUBLISHING
    September 2021 - January 2022 (4 months)
    Paris, France
    Migration et industrialisation de pipelines data :
    Migré les pipelines de R vers PySpark sur Dataiku.
    Corrigé les failles du code legacy, renforçant la fiabilité de l'infrastructure.
    PySpark Dataiku R Python

Recommendations

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Bachelor of Science (BSc) en Système d’Information et Management
    University College London
    2016
  • Master of Science (MSc) en Data Science
    King's College London
    2018

Certifications

Skill set

Categories