About Nathan
- LLM en production : agents, RAG hybride (dense + sparse + reranking LLM), serveurs MCP, évaluation adversariale type LLM-as-judge (prompt injection, escalade de privilèges, isolation des données)
- ML classique : classification multi-classes sur données déséquilibrées (XGBoost), explicabilité (SHAP), déploiement FastAPI / Kubernetes
- Data & MLOps sur AWS : pipelines ELT (Airbyte, Snowflake, dbt), lakehouse bronze/silver/gold, IaC (Terraform, CloudFormation), services managés (S3, ECS, Lambda, RDS), monitoring
- Gouvernance & enablement IA : politiques d'usage GenAI, sélection d'outils, workshops et accompagnement transverse des équipes Produit / R&D / Customer Success
- Pilotage du comité IA d'un éditeur SaaS : définition de la politique GenAI à l'échelle entreprise, framework adversarial pour évaluer la robustesse des agents
- Moteur de recommandation multilingue (RAG hybride embeddings + TF-IDF + ANN + reranking LLM) déployé en production
- Classification automatique de transactions bancaires sur des milliers de classes déséquilibrées, réduisant la catégorisation manuelle de 70%
French
Native or bilingual
English
Native or bilingual
German
Conversational
Experience
- MyUnisoftLead AI EngineerSOFTWARE PUBLISHINGSeptember 2025 - May 2026 (8 months)Paris, France
- Conception et déploiement d'un modèle XGBoost de classification multi-classes (milliers de classes déséquilibrées) pour la prédiction de codes comptables à partir de transactions bancaires : réduction de 70% de la catégorisation manuelle
- Développement de serveurs MCP sécurisés et conception d'un framework de test adversarial LLM-as-judge évaluant la robustesse des agents face aux injections de prompt, escalades de privilèges et attaques d'isolation de données
- Pilotage du comité IA : définition des politiques d'usage de l'IA générative à l'échelle de l'entreprise, sélection des outils, mise en place des bonnes pratiques
- Animation bimensuelle de workshops IA et accompagnement transverse (Produit, R&D, Customer Success) : évaluations de faisabilité technique, adoption des pratiques
- MajelanData Scientist / ML EngineerENTERTAINMENT AND LEISUREApril 2023 - August 2025 (2 years and 4 months)Paris, France
- Conception et développement d'un moteur de recommandation de podcasts multilingue combinant architecture RAG hybride (Azure OpenAI, TF-IDF, recherche ANN) et re-ranking par LLM, exposé via FastAPI et déployé sur AWS (EKS, Terraform, CloudFormation)
- Mise en place d'un pipeline ELT sur AWS (Airbyte → Snowflake → dbt) consolidant des millions d'enregistrements dans un lakehouse bronze/silver/gold ; création de tableaux de bord analytiques (Streamlit, Metabase) sur des datamarts pour les équipes internes et les utilisateurs
- Reprise en main d'une codebase legacy volumineuse et non documentée, support de services critiques en production après le départ de l'équipe de développement : rétro-ingénierie, stabilisation et maintenance
- CNRSStagiaire de rechercheRESEARCHMarch 2021 - June 2021 (3 months)Strasbourg, France
- Traitement, structuration et visualisation de jeux de données massifs issus de simulations dans le cadre du projet Future Circular Collider (FCC)
- Exploration d'outils et workflows Big Data pour l'analyse scientifique
- Présentation au FCC Jamboree organisé par le CERN
Recommendations
Be the first to recommend Nathan
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Diplôme bac+5 (niveau 7 RNCP) en Data ScienceCentraleSupélec2022Cursus orienté projets multi-secteurs (banque, distribution, agronomie, santé) : - Nettoyage et préparation de données - Analyse exploratoire (univariée, multivariée) - Réduction de dimensionnalité - Entraînement de modèles supervisés et non supervisés, optimisation d'hyperparamètres, évaluation de performance - Deep learning sur données textuelles et visuelles - Déploiement d'API et de dashboards - Versioning Git - Déploiement Big Data et calcul distribué (AWS) Stack : Numpy, Pandas, Scikit-learn, Matplotlib, Seaborn, Plotly, SHAP, TensorFlow, Keras, LightGBM, XGBoost, FastAPI, Streamlit, Gunicorn, PySpark
- Master en Physique des particules élémentairesUniversité de Strasbourg2021Mention Bien. Accent sur les concepts statistiques et probabilistes.