You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Thomas GeffroyTG

Thomas Geffroy

Data scientist - python/pySpark

€600/day
Paris, FR
3-7 years

Average response time: 1 hour

About Thomas

Bonjour,

Ingénieur diplômé de l'ENSTA ParisTech, spécialité intelligence artificielle et entreprenariat j'ai jusque ici principalement réalisé des missions de traitement automatique du langage naturel. (NLP) J'ai de plus été formé en école d'ingénieur pour la classification automatique d'images, la génération automatique de texte et d'images etc. Fort d'un cursus alliant mathématiques et informatique je serais à même de rapidement monter en compétence pour apporter une solution adaptée à vos besoins.

Je suis ouvert à tous projets data science, que ce soit dans le traitement automatique de texte ou d'images, de la conception jusqu'à l'industrialisation.

Je vous souhaite une excellente journée et espère bientôt travailler avec vous.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • Sapia Tech
    Formateur data analytics et machine learning
    EDUCATION AND E-LEARNING
    October 2021 - October 2021
    Paris, France
    Conception et animation d'un cours d'analyse de données massives avec python via l'analyse statistiques et la mise en place d'algorithmes de Machine Learning pour des applications diverses :

    ⦁ Fouille automatique de données
    ⦁ Classification automatique de données (classification supervisée)
    ⦁ Regroupement automatique de données (clustering)
    ⦁ Réduction de dimension
    ⦁ Traitement automatique du langage naturel (NLP)
    Machine learning Formation Data Analytics NLP
  • La Poste
    Data scientist en freelance
    CONSULTING AND AUDITS
    October 2019 - Today (6 years and 8 months)
    Guyancourt, France
    Au sein du pôle Big Data Analytics à Guyancourt, j’ai occupé le poste de data scientist et je suis intervenu sur 3 projets au cours de ces deux dernières années dans un environnement CDH (Cloudera Distribution including Hadoop) et particulièrement HDFS, Impala, Hive et Spark

    ⦁ Recueil des besoins métiers
    ⦁ Rédaction des expressions de besoins
    ⦁ Développement en Spark (Scala et Python), Panda et intégration Jenkins
    ⦁ Rédaction des demandes sur Jira
    ⦁ Résolution de problèmes techniques pour les developpeurs du DataLake (config GPU, Spark, installations paquets python …)
    ⦁ Gestion de ressources du Cluster (cloudera manager)
    ⦁ Tests et intégration : Unitest, Sonarcube et Jenkins
    ⦁ Utilisation de Gitlab et Jenkins pour l’intégration continue
    ⦁ Rédaction de la documentation technique Confluence (commande de lancement, périmètres d’actions…)
    ⦁ Rédaction des dossiers d’exploitations
    ⦁ Travail d’optimisation de manipulation de données avec DSS
    ⦁ Conception d’un algorithme de classification non supervisé des données courrier basé sur l’algorithme d’OPTICS de la librairie python scikit-learn (pySpark, scikit-learn)
    ⦁ Conception et entraînement d’un algorithme de Deep Learning pour le parsing d’adresses postales basé sur une génération synthétique d’adresses à partir de référentiels adresses et un réseau de portes GRU (PySpark, keras, tensorflow)
    ⦁ Mise en place d’un pipeline d’entraînement et application d’un algorithme de Deep Learning dans un environnement Spark avec GPU (pySpark, keras, tensorflow)
    ⦁ Intervention sur le datalake et (7 tables différentes mise en production de OPTICS et des algorithmes de parsing)
    ⦁ Entraînement d'un modèle de reconnaissance vocale (STT) via le toolkit nemo de Nvidia : préparation des données, fine tuning, recette du modèle
    ⦁ Fine tuning d'un modèle NER (Named Entity Recognition) Transformers pour la reconnaissance d'entités adresses et destinataires
    ⦁ Fine tuning d'un modèle de reconnaissance d'objet via la pipeline YOLOv5 pour la reconnaissance de DCP dans des documents non formatés (scan PDF, images, etc)
    Data science Spark TensorFlow keras Python Scikit-learn Big Data NLP
  • Sopra Steria
    Stagiaire data scientist
    DIGITAL AND IT
    April 2019 - October 2019 (6 months)
    Région de Paris, France
    En mission chez La Poste j'ai occupé un rôle de data ingénieur pour la complétion de référentiels adresses après nettoyage, filtrage et sélections d'éléments adresses ainsi que data scientist lors de la mise en place d'un environnement de développement pour le deep learning et la conception d'un réseau de parsing d'adresses

    ⦁ Recueil des besoins métiers
    ⦁ Rédaction des expressions de besoins
    ⦁ Développement en Spark (Scala et Python), Panda et intégration Jenkins
    ⦁ Rédaction des demandes sur Jira
    ⦁ Gestion de ressources du Cluster (cloudera manager)
    ⦁ Tests et intégration : Unitest, Sonarcube et Jenkins
    ⦁ Utilisation de Gitlab et Jenkins pour l’intégration continue
    ⦁ Conception d'une solution Deep Learning pour le parsing d'adresses
    ⦁ Intervention sur le datalake, en recette et mise en production
    ⦁ Configuration d'une carte graphique (Tesla V100) et mise en place d'une structure pour faciliter le développement et l'échange de données
    ⦁ Complétion d'un référentiel adresse à partir de la donnée des lettres scannées en pySpark
    Spark NLP Big Data Data Engineer Deep Learning Atlassian JIRA Atlassian Confluence Gitlab

Recommendations

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Diplôme d'ingénieur
    ENSTA ParisTech - École Nationale Supérieure de Techniques Avancées
    2019
    Cursus ingénieur : 3ème année en voie Intelligence Artificielle avec une spécialisation en entreprenariat /intrapreneuriat 2ème année en voie Signal, Informatique et Systèmes spécialité Technologies de l'Information et des Communications
  • Licence
    Institut Villebon Georges Charpak
    2016
    Licence en Science et Technologie avec spécialisation en IPMI (Informatique Physique Mathématique et Ingénierie)

Skill set

Categories