About Geneviève
French
Native or bilingual
English
Conversational
Experience
- DoleadData ScientistDIGITAL AND ITAugust 2025 - September 2025 (1 month)Dans l'équipe Data & Science (4/5 personnes) de la startup Dolead, spécialisée dans le marketing digital.Mission courte (20 jours) visant à explorer la possibilité de prédire le nombre de leads générés par des campagnes publicitaires Facebook, en fonction (notamment) des paramètres donnés en entrée lors du paramétrage de ces campagnes:● Analyse exploratoire des données (Pandas, Plotly)● Entraînement et évaluation de modèles de régression supervisée (Scikit-learn)● Documentation et communication
- Office français de la biodiversitéData scientist (CDD)ENVIRONMENTALSeptember 2024 - April 2025 (7 months)Vincennes, FranceDans l'Unité Données et Appui Méthodologigue (~15 personnes)Développement d'un outil IA frugal pour l'extraction de données structurées à partir de PDFs:● Analyse de données sur les services publics d'eau et d'assainissement (SISPEA)● Acquisition, analyse et labellisation de rapports au format PDF, sur le prix et la qualité des services d'eau et d'assainissement (RPQS)● Développement en Python de l'outil NARVAL permettant d'extraire les valeurs d'indicateurs SISPEA des rapports RPQS au format PDF : approche IA frugale mêlant des méthodes heuristiques légères et des petits modèles de langage (SLM)● Evaluation sur un corpus de 45 PDFs : définition et analyse des métriques, processus d'amélioration incrémentale de NARVAL après analyse des erreurs● Estimation de l'impact carbone (1g CO2eq par PDF)● Automatisation de l'import du fichier output de NARVAL sur SISPEA (notebook uniquement)● Analyse critique de la solution développée: limitée aux RPQS non scannés de "petites" collectivités, précision de 91% et rappel de 84% pour la solution appelant le SLM, précision de 100% et rappel de 48% pour la solution extrayant uniquement les indicateurs de tableaux récapitulatifs, ...● Discussion des perspectives● Documentation et communication𝘗𝘺𝘵𝘩𝘰𝘯 - 𝘗𝘢𝘯𝘥𝘢𝘴 - 𝘏𝘶𝘨𝘨𝘪𝘯𝘨 𝘍𝘢𝘤𝘦 𝘛𝘳𝘢𝘯𝘴𝘧𝘰𝘳𝘮𝘦𝘳 - 𝘚𝘘𝘓 - 𝘎𝘪𝘵--------------------------------------------Projet annexe (<10% du temps) : croisement des données de Naïades sur la qualité des cours d'eau avec les données de Carthage sur la cartographie des cours d'eau● Analyse exploratoire des bases Naïades et Carthage● Création de graphes de stations comprenant toutes les stations Naïades en amont et en aval d'une station donnée● Quelques exemples de visualisation de données physico-chimiques sur ces graphes𝘗𝘰𝘴𝘵𝘨𝘳𝘦𝘚𝘘𝘓 - 𝘗𝘰𝘴𝘵𝘎𝘐𝘚 - 𝘱𝘨𝘙𝘰𝘶𝘵𝘪𝘯𝘨 - 𝘗𝘺𝘵𝘩𝘰𝘯 - 𝘗𝘢𝘯𝘥𝘢𝘴 - 𝘎𝘦𝘰𝘱𝘢𝘯𝘥𝘢𝘴 - 𝘎𝘪𝘵
- DoleadData scientist (freelance)DIGITAL AND ITOctober 2023 - April 2024 (6 months)Dans l'équipe Data & Science (4/5 personnes) de la startup Dolead spécialisée dans le marketing digital.Contribution au développement d’une pipeline de lead scoring :● Nettoyage et analyse de données (SQL, pandas, plotly)● Ajout et sélection de features● Entraînement, sélection et calibration de modèles de classification supervisée (régression logistique, forêts aléatoires, gradient boosting) sous BigQuery ML + dbt● Utilisation des résultats pour alimenter les modèles de bidding de Google/Meta et étude d'impact● Documentation et communication
Reviews
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Formation Bootcamp Data ScientistDataScientest.com (partenariat Mines Paris Tech PSL)2022Formation bootcamp, parcours data scientist (mai à juillet 2022) 300h de 𝐜𝐨𝐮𝐫𝐬 sous la forme de notebooks dirigés et masterclasses: ● Programmation : fondamentaux Python, Numpy, Pandas ● Data visualisation : Matplotlib, Seaborn, Bokeh ● Machine Learning avec scikit-learn : classification, régression, clustering, réduction de dimensions, régularisation, text mining, séries temporelles (avec statsmodels) ● Deep Learning avec Keras et Tensorflow: réseaux de neurones denses, convolutifs, récurrents, auto-encodeurs, GANs, optimisation des architectures neuronales et des hyperparamètres, régularisation, transfer learning, introduction au reinforcement learning ● Introduction au Data Engineering: bases de données, SQL, PySpark 100h de 𝐩𝐫𝐨𝐣𝐞𝐭 𝐟𝐢𝐥 𝐫𝐨𝐮𝐠𝐞 en trinôme sur un sujet au choix (parmi 7): détection non supervisée de sons anormaux 👉 https://github.com/gefleury/datascientest_anomalous_sounds
- Doctorat en physique théoriqueUniversité Paris 62010Préparée au CEA Saclay d'octobre 2006 à octobre 2009, soutenue en janvier 2010. Simulations Monte Carlo Quantique des effets de l'interaction coulombienne sur la localisation d'Anderson dans le gaz 2D d'électrons.
Certifications
- Data ScientistDataScientest & Mines ParisTech PSL2022
- Microsoft Certified: Power BI Data Analyst AssociateMicrosoft