About Erwan
French
Native or bilingual
English
Fluent
Spanish
Conversational
Experience
- Erwan VautierData ScientistCONSULTING AND AUDITSDecember 2021 - Today (4 years and 6 months)Bordeaux, FrancePlateforme e-commerce spécialisée dans la vente d’outillage en ligne (1 an) :
- Classification automatique des produits d'outillage en une cinquantaine de catégories à partir des descriptions et des images produits (NLP + Computer Vision). Tests de différentes méthodologies et modèles de prédiction.
- Création d'un modèle de détection d'attributs produits à partir des descriptions via LLM avec différents modèles open-source ou non (Mistral, LLama, OpenAI).
- Création d'une API Flask permettant d'appeler différents modèles depuis des requêtes sur module PrestaShop (détection automatique d'une catégorie et attributs lors de l'import d'un produit sur le site e-commerce).
- Gestion du cycle de développement des différents projets (Git, Docker, Kubernetes, CI/CD).
Groupe mondial de communication et de publicité (6 mois) :- Encodage des produits à partir de leurs descriptions et images (NLP + extraction des features image) et développement de modèles de Machine Learning basés sur les vecteurs obtenus (multimodal) : segmentation, clustering, scoring. Utilisation du modèle CLIP pour extraire des features sémantiques des images et construire des vecteurs multimodaux.
- Intégration de diverses API Google Cloud Vision (GCV) dans la phase de traitement pour enrichir les descripteurs textuels des images (détection d'objets, détection de texte, etc.).
- Gestion du cycle de développement (Git, Docker) et déploiement des modèles dans un environnement cloud AWS (EC2, S3, SageMaker, Lambda).
Projets divers :- Création d’outils de récupération de données sur le web en Python (requests, BeautifulSoup, Selenium, Scrapy, etc.).
- Développement d’applications Windows ou macOS (Kivy, Tkinter) pour exploiter divers outils ou modèles (ex : scraping LinkedIn et qualification de leads).
- Création d’un système embarqué sur Raspberry Pi permettant l’écoute de l’utilisateur, la communication avec un modèle fine-tuné hébergé chez OpenAI, et la restitution vocale.
- INEOXData ScientistCONSULTING AND AUDITSOctober 2019 - November 2021 (2 years and 1 month)Paris, FrancePlateforme leader dans l'immobilier en ligne (1 an) :
- Traitements et analyses de données de l’immobilier à destination des médias. Création, gestion et déploiement de baromètres statistiques et de dataviz exploités par les équipes métiers (Tableau).
- Développement de modèles de Machine Learning pour diverses tâches (détection des annonces doublons à partir des images et des descriptions, modèle de prédiction du prix d’un logement en fonction de ses caractéristiques, etc.)
- Exploitation de modèles de séries temporelles (ARIMA, SARIMA) dans le but de prédire l’évolution du prix des loyers et des locations saisonnières.
Réseau national de magasins d’optique (6 mois) :- Audit de la qualité de l’environnement data, analyse des données transactionnelles et clientèles, rapport descriptif de l’état actuel (valeurs manquantes, distribution, liens statistiques) et développement de solutions à mettre en place.
- Création de modèles de Machine Learning (segmentation clientèle, modèle de prédiction des ventes et du churn/anti-churn, système de recommandation item-item et user-user), automatisation et activation marketing (plateforme en ligne, campagne mail personnalisée, etc.)
Projets divers :- Gestion et manipulation de bases de données, extraction et traitements, création et mise en production de flux de données automatisés.
- Traitement et analyse de données pour des besoins marketing, analyse descriptive des données clients, ventes et trafic et restitution des analyses aux équipes métiers.
- Développement de modèles de Machine/Deep Learning pour diverses boîtes : Segmentation clientèle, modèle de prédiction de ventes/churn, etc.
- TheContilleryData ScientistCONSULTING AND AUDITSApril 2018 - October 2019 (1 year and 6 months)Paris, France
- Conception, développement et déploiement de plusieurs modèles de traitement d’images (CV) pour améliorer la communication visuelle des marques sur les réseaux sociaux. Clustering à partir des features extraites de modèles pré-entraînés type ResNet (KMeans déterministe, CAH), classification automatique des images, détection et extraction d’objets (Mask R-CNN) et modèle de prédiction de la performance visuelle.
- Exploration et recherche des nouvelles méthodes permettant de contourner les problèmes inhérents à certaines catégories (extraction des objets, recherches sur les distances, nouveaux modèles, etc.)
- Développement d’outils Python permettant la récupération de données d’engagements liées aux images sur les réseaux sociaux (WebScraping/Crawling).
- Conception d’applications web (Flask) permettant la visualisation, l’exploitation et la validation des modèles (clustering, score d’engagement, similarité entre les images, etc.)
- Mise en production des outils d’extraction et de contrôle des flux de données. Gestion du cycle de développement des différents projets (Git, Docker, CI/CD)
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Diplôme d'ingénieur, Mathématiques et statistiquesEcole nationale de la Statistique et de l'Analyse de l'Information2018Statistiques et Analyse de l'information, Data Science, Machine/Deep Learning, Modélisation. Python, R, SAS.
- Licence en économie appliquéeUniversité Paris Dauphine2017Licence en économie appliquée en double diplôme avec l’ ENSAI