You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Khalil SagoumiKS

Khalil Sagoumi

Data Scientist | ML Engineer | Python | GenAI

€490/day
Paris, FR
3-7 years

Average response time: 1 hour

About Khalil

Ingénieur en Science de la donnée et Statistique, diplômé de l'Ecole Supérieure d'Ingénieur Léonard de Vinci (majeure Data & Intelligence Artificielle). Fort d'une expérience de 4 ans en tant que Data Scientist/ML Engineer d'abord au sein d'Orange puis au SAMU centre 15 des Yvelines (Hôpital André Mignot), je serais heureux de vous accompagner dans vos projets, de la simple exploration de données à la construction de modèles complexes.


Technologies et frameworks

Langage de programmation : Python, PySpark, C, C++, R, SQL
Data Science / ML : Python, PyTorch, TensorFlow, Spark, Elasticsearch, Lightning, ClearML, OpenCV, Scikit-learn, LlamaIndex, LangChain, NEO4J, Multiprocessing, NumPy, SciPy, Pandas, Matplotlib, Selenium, AutoML, H2O, Flask API
Software / Cloud : Git, Azure, GCP, Docker, Kubernetes, Jupyter, VSCode, Databricks
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 30km)

Experience

  • Milhano SAS
    Data scientist ML Engineer
    LUXURY GOODS
    November 2024 - April 2025 (5 months)
    Paris, France
    - Développement d'un chatbot IA (RAG) enrichi de données produits et destinés aux vendeurs, qui permet de fournir
    instantanément un descriptif détaillé d'articles via une API web (FastAPI) (Composition, types de cuirs, caractéristiques)
    - Développement d'un pipeline d'enrichissement de données en extrayant les champs clés de factures avec Qwen 2.5 vLLM,
    traitement avec Polars et injection dans une base DuckDB
    - Création de dashboards qui analysent les ventes en fonction des heures, des saisons et des produits achetés
    (Power BI)
    RAG FastAPI LLM DuckDB CAG
  • SAMU 78
    Data Scientist / ML Engineer
    HEALTH AND WELLNESS
    December 2022 - July 2024 (1 year and 8 months)
    Le Chesnay, France
    Définition de la stratégie de valorisation de la donnée et mise en place des outils de
    traitement de la donnée avec la direction du SAMU (Gouvernance des données)
    • Mise en place de la nouvelle architecture cloud de l’entrepôt de donnée avec GCP et
    migration des données (Oracle, BigQuery)
    • Création d’une pipeline de traitement de données médicales avec anonymisation afin de
    développer un algorithme permettant de prédire les phénomènes de saisonnalité de
    certaines pathologies (grippes, bronchiolite, pathologies psychiatriques) pour adapter les
    ressources médicales (DataFlow, Times Series, LSTM, Gradient Boosting)
    • Extraction, transformation et chargement des données issues des rapports médicaux de
    régulation afin de nettoyer, fiabiliser et organiser cette donnée pour la construction des
    études statistiques
    • Construction d’algorithmes afin de clustériser les phénotypes de parcours de soins
    et de prédire les éventuelles réhospitalisations (Partitioning Around Medoids – PAM,
    Python)
    • Création et mise en production de dashboards qui analysent la répartition des appels par
    pathologies le département des Yvelines (Tableau /Power BI)
    Cloud GCP Python Machine learning NLP Git Github Actions CI/CD Docker
  • Orange SA
    Data Scientist
    TELECOMMUNICATIONS
    October 2020 - October 2022 (2 years)
    Paris, France
    • Mise en place de requête HSQL afin de traiter et analyser la donnée du Hub Data (Apache Hive, Hadoop)
    • Optimisation des pipelines de données pour réduire les coûts (Airflow)
    • Développement d’un RNN (LSTM) afin de détecter les incidents et les dysfonctionnements sur les domaines techniques (IoT, Roaming et Offres
    WholeSale)
    • Création de KPI et de Dashboard d’exploitation (Tableau Software, Grafana)
    • Automatisation des tableaux de bord sur la donnée mobile (Qlik Sense)

Recommendations

Be the first to recommend Khalil

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Ingénieur généraliste
    ESILV
    2022
    Machine Learning, Deep Learning, NLP, NoSQL, Python for Data, DataViz, Statistique de la donnée, Base de données et interopérabilité, Probabilités numériques, Statistique inférentielle, Optimisation et Recherche Opérationnelle, Cloud and virtualization techniques, Graph and minning Soft Skills : Savoir vendre ses idées, Team Building, méthode Agile et Design Thinking
  • Classe préparatoire MPSI/MP
    Lycée Jeanne d'Albret
    2019

Skill set (34)

Categories