You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Jean-Christophe CazesJC

Jean-Christophe Cazes

Data Scientist, Msc Statistics and ML

€750/day
Paris, FR
3-7 years

Average response time: 1 hour

About Jean-Christophe

Je suis diplômé d'un Master de Mathématiques spécialité Statistiques et Machine Learning de l'Université Paris 6.

J'ai travaillé sur de nombreux modèles allant du traitement de texte (NLP, NLU) à la vision par ordinateur (Computer Vision) ainsi que sur des modèles beaucoup plus statistiques (notamment séries temporelles) au cours de mes expériences avec des résultats qui ont été actionnables pour l'entreprise.

Mes expériences vont du projet de R&D de détection de fraude sur la blockchain, en passant par un modèle de détection de doublons dans les annonces de Seloger par analyse de textuelle et des photo jusqu'à la transformation d'un site d'annonce à une marketplace par des modèles de scoring.

Ma curiosité me pousse a essayer énormément et à itérer rapidement afin de trouver une solution qui satisfaisante et élégante

Je suis un Data Scientist qui sait s'adapter aux différentes stacks technologiques, aux environnements nouveaux et travailler avec les différents métiers et surtout je suis passionné par ce que je fais!
  • French

    Native or bilingual

Remote only
Primarily works remotely

Experience

  • Onfido
    Data Scientist
    September 2022 - Today (3 years and 9 months)
    Paris, France
  • Groupe SeLoger
    Data Scientist
    REAL ESTATE
    December 2019 - September 2022 (2 years and 9 months)
    Île-de-France, France
    Travail d'identification de biens immobiliers au sein des annonces:

    Elaboration de modèles de Machine Learning dans un contexte de graphes avec mesures de similarité (MinHashing LSH, Bucketed RandomProjection LSH)
    Utilisation de modèles de représentation de textes (BERT, camemBERT) et Transport Optimal entre représentations
    Utilisation de modèles basés sur la similarité d'images (SIFT, ResNet, Faiss, NetVlad)
    Calculs parallélisés et traitement de volumes de données important sur AWS avec Spark
    Mise en production de modèle
    Analyse Business de la fraude aux duplicats d'annonces

    Travail sur la modélisation de la performance annonce:

    Mise en place de tests statistiques et inférence
    Usage de méthodes de bootstrapping, estimation par méthodes de Monte Carlo
    Modélisation par séries temporelles, modèles autorégressifs
    Analyse canonique des corrélations
    Analyse et segmentation des marchés par méthodes statistiques
    Aggrégation de métriques (Modélisation par Expert Advice Problem)

    Produit BoostExtend:
    Modélisation de la visibilité et de la compétitivité des marchés immobiliers des annonces par méthodes statistiques
    Développement, Analyse Offline et Industrialisation de 3 Produits : Boost Performance
    Proof Product, Boost Recommender System et Boost Performance Prediction à l'aide de notre
    modèle de visibilité

    Operationnal Lead de la Team Scoring AVIV

    Lead Valuation Model:
    Modélisation de la valeur incrémentale d'un lead sur les sites immobiliers du Groupe AVIV par modèle probabiliste.

    Lead Opérationnel sur son implémentation:
    Montée en compétence de l'équipe
    Segmentation du marché immobilier allemand et son évaluation
    Estimation du nombre de leads avant transaction immobilière au sein des segments
    Calcul de la valeur incrémentale d'un lead pour chaque annonce
    Modélisation de la tension des marchés immobiliers à partir du modèle Property Identification
    Sélection les annonces les plus pertinentes à mettre en avant et Marketing Mix Modelling à l'aide de celle-ci.
  • Nexeo Groupe
    Stage Machine Learning
    BANKING AND INSURANCE
    April 2019 - October 2019 (6 months)
    Machine Learning dans la Blockchain au sein du Nex' Lab
    (Graphes, Apprentissage Semi Supervisé, Analyse Statistique de Graphes, AML KYC)

    Stage de fin d’études sur la détection de schémas de Ponzi sur la blockchain ETHEREUM et
    regroupement d’adresses frauduleuses via des modèles de Machine Learning (NLP / Deep Learning / Analyse Statistique de Graphes)

    Réalisations:

    Requêtes, Parsing et Preprocessing des données
    Optimisation des calculs lors du prétraitement des données
    Analyse statistique de la distribution des données
    Elaboration de modèles de Machine Learning dans un contexte d’imbalanced dataset et
    d’apprentissage semi-supervisé sur des graphes
    Déploiement de calculs parallélisés dans un contexte de volume de données important sur Google
    Cloud Platform avec Spark

    Environnement:
    Git (flow), numpy, Python, Pandas, Scikit-Learn, Tensorflow 2.0, keras, graph-tool, networkx, SMOTE,
    node2vec, word2vec, nltk

Recommendations

Be the first to recommend Jean-Christophe

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master 2 (M2), Mathématiques, Statistiques et Machine Learning
    Université Pierre et Marie Curie
    2019
    Master 2 (M2), Mathématiques, Statistiques et Machine Learning
  • Master 1, Mathématiques et Applications
    Université Pierre et Marie Curie
    2018
    Master 1, Mathématiques et Applications

Skill set (7)

Categories