You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Geneviève FleuryGF

Geneviève Fleury

Data scientist | ML | NLP | Python | SQL | R&D

€400/day
8 projects
Palaiseau, FR
0-2 years

Average response time: 1 hour

About Geneviève

Je suis data scientist depuis 2 ans et ai travaillé auparavant plus de 15 ans comme chercheure en physique (quantique) fondamentale.

Mon positionnement en data science est pour l'instant assez généraliste, avec une expertise particulière dans le traitement de données tabulaires par des méthodes usuelles de machine learning et dans le traitement automatique du langage.

Forte d’une longue expérience en recherche scientifique, j’apporte rigueur, méthode et clarté aux projets que j’accompagne.

⚙️Stack : Python, SQL, GCP, Dbt, Power BI

🚀 N’hésitez pas à me contacter pour échanger sur vos projets data ou en savoir plus sur mes réalisations.




  • French

    Native or bilingual

  • English

    Conversational

Can work on-site
Palaiseau (up to 30km)

Experience

  • Dolead
    Data Scientist
    DIGITAL AND IT
    August 2025 - September 2025 (1 month)
    Dans l'équipe Data & Science (4/5 personnes) de la startup Dolead, spécialisée dans le marketing digital.

    Mission courte (20 jours) visant à explorer la possibilité de prédire le nombre de leads générés par des campagnes publicitaires Facebook, en fonction (notamment) des paramètres donnés en entrée lors du paramétrage de ces campagnes:
    ● Analyse exploratoire des données (Pandas, Plotly)
    ● Entraînement et évaluation de modèles de régression supervisée (Scikit-learn)
    ● Documentation et communication
    Scikit-learn Plotly Pandas Exploratory Data Analysis Machine learning
  • Office français de la biodiversité
    Data scientist (CDD)
    ENVIRONMENTAL
    September 2024 - April 2025 (7 months)
    Vincennes, France
    Dans l'Unité Données et Appui Méthodologigue (~15 personnes)

    Développement d'un outil IA frugal pour l'extraction de données structurées à partir de PDFs:
    ● Analyse de données sur les services publics d'eau et d'assainissement (SISPEA)
    ● Acquisition, analyse et labellisation de rapports au format PDF, sur le prix et la qualité des services d'eau et d'assainissement (RPQS)
    ● Développement en Python de l'outil NARVAL permettant d'extraire les valeurs d'indicateurs SISPEA des rapports RPQS au format PDF : approche IA frugale mêlant des méthodes heuristiques légères et des petits modèles de langage (SLM)
    ● Evaluation sur un corpus de 45 PDFs : définition et analyse des métriques, processus d'amélioration incrémentale de NARVAL après analyse des erreurs
    ● Estimation de l'impact carbone (1g CO2eq par PDF)
    ● Automatisation de l'import du fichier output de NARVAL sur SISPEA (notebook uniquement)
    ● Analyse critique de la solution développée: limitée aux RPQS non scannés de "petites" collectivités, précision de 91% et rappel de 84% pour la solution appelant le SLM, précision de 100% et rappel de 48% pour la solution extrayant uniquement les indicateurs de tableaux récapitulatifs, ...
    ● Discussion des perspectives
    ● Documentation et communication

    𝘗𝘺𝘵𝘩𝘰𝘯 - 𝘗𝘢𝘯𝘥𝘢𝘴 - 𝘏𝘶𝘨𝘨𝘪𝘯𝘨 𝘍𝘢𝘤𝘦 𝘛𝘳𝘢𝘯𝘴𝘧𝘰𝘳𝘮𝘦𝘳 - 𝘚𝘘𝘓 - 𝘎𝘪𝘵

    --------------------------------------------

    Projet annexe (<10% du temps) : croisement des données de Naïades sur la qualité des cours d'eau avec les données de Carthage sur la cartographie des cours d'eau
    ● Analyse exploratoire des bases Naïades et Carthage
    ● Création de graphes de stations comprenant toutes les stations Naïades en amont et en aval d'une station donnée
    ● Quelques exemples de visualisation de données physico-chimiques sur ces graphes

    𝘗𝘰𝘴𝘵𝘨𝘳𝘦𝘚𝘘𝘓 - 𝘗𝘰𝘴𝘵𝘎𝘐𝘚 - 𝘱𝘨𝘙𝘰𝘶𝘵𝘪𝘯𝘨 - 𝘗𝘺𝘵𝘩𝘰𝘯 - 𝘗𝘢𝘯𝘥𝘢𝘴 - 𝘎𝘦𝘰𝘱𝘢𝘯𝘥𝘢𝘴 - 𝘎𝘪𝘵
    Python Natural Language Processing (NLP) PostgreSQL Hugging Face Rédaction de rapport
  • Dolead
    Data scientist (freelance)
    DIGITAL AND IT
    October 2023 - April 2024 (6 months)
    Dans l'équipe Data & Science (4/5 personnes) de la startup Dolead spécialisée dans le marketing digital.

    Contribution au développement d’une pipeline de lead scoring :
    ● Nettoyage et analyse de données (SQL, pandas, plotly)
    ● Ajout et sélection de features
    ● Entraînement, sélection et calibration de modèles de classification supervisée (régression logistique, forêts aléatoires, gradient boosting) sous BigQuery ML + dbt
    ● Utilisation des résultats pour alimenter les modèles de bidding de Google/Meta et étude d'impact
    ● Documentation et communication


    Big Query Python SQL Analyse de données Machine learning

Reviews

5,0

Out of 1 rating

T

Thibault

Dolead

Reviewed on 09/11/2023

Geneviève is very professional and a good scientist. She implemented a scoring system for us. She did a great analysis of our variables, worked on data processing and suggested new variables to add in the model. Geneviève trained and optimised (including hyper-parameters) a variety of models. Geneviève provided a clear documentation on Notion. She presented her results to stakeholders with great clarity. Techno: Bigquery, SQL, DBT, Python

Recommendations

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Formation Bootcamp Data Scientist
    DataScientest.com (partenariat Mines Paris Tech PSL)
    2022
    Formation bootcamp, parcours data scientist (mai à juillet 2022) 300h de 𝐜𝐨𝐮𝐫𝐬 sous la forme de notebooks dirigés et masterclasses: ● Programmation : fondamentaux Python, Numpy, Pandas ● Data visualisation : Matplotlib, Seaborn, Bokeh ● Machine Learning avec scikit-learn : classification, régression, clustering, réduction de dimensions, régularisation, text mining, séries temporelles (avec statsmodels) ● Deep Learning avec Keras et Tensorflow: réseaux de neurones denses, convolutifs, récurrents, auto-encodeurs, GANs, optimisation des architectures neuronales et des hyperparamètres, régularisation, transfer learning, introduction au reinforcement learning ● Introduction au Data Engineering: bases de données, SQL, PySpark 100h de 𝐩𝐫𝐨𝐣𝐞𝐭 𝐟𝐢𝐥 𝐫𝐨𝐮𝐠𝐞 en trinôme sur un sujet au choix (parmi 7): détection non supervisée de sons anormaux 👉 https://github.com/gefleury/datascientest_anomalous_sounds
  • Doctorat en physique théorique
    Université Paris 6
    2010
    Préparée au CEA Saclay d'octobre 2006 à octobre 2009, soutenue en janvier 2010. Simulations Monte Carlo Quantique des effets de l'interaction coulombienne sur la localisation d'Anderson dans le gaz 2D d'électrons.

Certifications

Skill set

Categories