You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Hugo PrevoteauHP

Hugo Prevoteau

Data Scientist (NLP, LLM, ASR)

€400/day
Paris, FR
3-7 years

Average response time: 1 hour

About Hugo

🧠 Ingénieur en Intelligence Artificielle avec 4+ ans d’expérience, je conçois des solutions sur-mesure en NLP, LLM, ASR et RAG pour automatiser les processus métier, optimiser les performances et créer des leviers de croissance par la donnée.

🚀 Après un parcours mêlant recherche appliquée et industrie (Amazon Alexa AI), j’ai fondé Yula Studio, où j’aide les entreprises à intégrer les dernières avancées en IA générative (GPT, LLaMA, Mistral, agents IA, vector databases) à leurs outils et systèmes existants.

🔍 Expertises clés :
• NLP / LLM : classification d’emails, extraction d’informations, génération de texte, fine-tuning de modèles pré-entraînés (GPT, BERT, LLaMA, Mistral)
• ASR / Speech-to-Text : modèles low-resource, adaptation multilingue (Alexa Arabic, FireTV), rescoring, data augmentation
• RAG & Agents IA : vector search, génération augmentée par les données, systèmes multi-agents intelligents (LangChain, Pinecone)
• ML & Data Engineering : pipelines de traitement, structuration de bases de données, modèles supervisés et non supervisés

🛠️ Stack technique :
Python (PyTorch, TensorFlow, LangChain, FastAPI) – AWS (SageMaker, EC2) – Docker – Pinecone – Neo4j – React – Heroku

🤝 J’interviens sur tout le cycle de vie d’un projet IA : cadrage, prototypage, mise en production, accompagnement post-livraison. À l’aise en autonomie ou intégré à vos équipes, je m’adapte à vos enjeux métiers comme techniques.

📬 Discutons de vos besoins en IA : un audit rapide, un prototype ou une intégration clé en main ? Je vous propose une solution pragmatique et personnalisée.
  • French

    Native or bilingual

  • English

    Native or bilingual

  • Spanish

    Native or bilingual

Can work on-site
Paris (up to 50km)

Experience

  • Yula
    Chief Technology Officer
    November 2023 - Today (2 years and 7 months)
    Paris, France
    Développement de systèmes RAG (Retrieval-Augmented Generation) pour automatiser le service client e-commerce avec des LLM

    • Conception et déploiement d’une solution RAG (Retrieval-Augmented Generation) basée sur des grands modèles de langage (LLM) afin d’automatiser les réponses aux demandes clients, avec un impact mesurable sur l’efficacité opérationnelle, la précision des réponses et la satisfaction utilisateur.
    • Création d’un pipeline de données NLP complet pour l’extraction, le nettoyage, l’indexation et le stockage vectoriel de contenus textuels, garantissant une récupération rapide et pertinente des documents.
    • Mise en œuvre d’une architecture modulaire combinant systèmes multi-agents et LLMs pour une gestion intelligente des interactions complexes avec les utilisateurs.
    • Recrutement et coordination d’une équipe pluridisciplinaire (Front-End, Full Stack, Machine Learning Engineer) pour assurer la conception, le déploiement et l’amélioration continue des services IA en production.
    • Encadrement technique des choix d’architecture et des bonnes pratiques de développement collaboratif sur des applications mêlant intelligence artificielle et interfaces web performantes.

    Technologies : LangChain, Pinecone, FastAPI, React, Remix, Heroku

    Mots-clés : RAG, LLM, NLP, retrieval-augmented generation, multi-agent systems, chatbot, vector database, Python, FastAPI, LangChain, React, Heroku, e-commerce automation
  • Amazon
    Applied Scientist
    August 2021 - November 2023 (2 years and 3 months)
    London, UK
    Expert en reconnaissance vocale (ASR) spécialisée dans les environnements low-resource

    • Développement de modèles ASR RNN-T performants dans des contextes à faibles ressources, avec intégration de données hétérogènes (données réelles et synthétiques), ayant permis une réduction relative du WER de 83 %.
    • Mise en place d’un cadre d’apprentissage incrémental réduisant les coûts d’entraînement de 75 %, optimisant les itérations en production.
    • Spécialisation en adaptation au domaine et à la localisation via la génération de données audio synthétiques, pour des systèmes de reconnaissance vocale par requête vocale (voice search) basés sur des modèles pré-entraînés.
    • Optimisation des performances grâce à des techniques avancées de rescoring : first pass shallow fusion, Internal Language Model Estimation (ILME), RescoreBERT, ayant permis une réduction relative de 8 % du WER.
    • Maîtrise de la préparation des données, de l’augmentation de données audio, du transfer learning, de l’incremental learning et du fine-tuning de modèles ASR. Expérience dans le data source weight mixing pour améliorer la robustesse et la précision des modèles.

    Technologies : RNN-T, Whisper, Kaldi, ESPnet, HuggingFace Transformers, PyTorch, TensorFlow, wav2vec 2.0, BERT, RescoreBERT

    Mots-clés : speech recognition, ASR, WER, RNN-T, domain adaptation, language model fusion, synthetic audio, low-resource ASR, incremental learning, fine-tuning, audio data augmentation
  • Amazon
    Applied Scientist
    February 2021 - July 2021 (5 months)
    Barcelona, Spain
    Recherche appliquée sur la scalabilité des modèles de MARL (Multi-Agent Reinforcement Learning) avec un nombre d’agents dynamique

    • Étude avancée sur la scalabilité des modèles de renforcement multi-agent (MARL) dans des contextes où le nombre d’agents varie à l’inférence, un défi clé pour les applications temps réel (logistique, trafic, robotique).
    • Implémentation d’algorithmes collaboratifs state-of-the-art tels que CommNet et BiCNet, ainsi que de plusieurs baselines de référence, afin d’évaluer leur robustesse et leur efficacité dans des environnements multi-agents complexes.
    • Conception d’un banc d’essai réaliste basé sur une simulation de trafic routier autonome, permettant de comparer les performances en termes de coordination, de scalabilité et de temps de convergence.
    • Présentation des résultats et analyses lors d’une conférence interne, mettant en avant les implications pour la recherche appliquée en intelligence collective distribuée.

    Technologies : Ray RLlib, OpenAI Gym, PyTorch, TensorFlow, Docker, AWS (SageMaker, EC2)
    Mots-clés : MARL, reinforcement learning, multi-agent systems, CommNet, BiCNet, collaborative AI, simulation trafic, RLlib, Gym, AWS SageMaker, Docker, PyTorch, TensorFlow

Recommendations

Be the first to recommend Hugo

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Software Engineering
    天津大学
    2021
    Software Engineering
  • Master of Science
    ESILV - Ecole Supérieure d'Ingénieurs Léonard de Vinci
    2021
    Master's degree, Data Sciences

Skill set (10)

Categories