You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Jn JnJJ

Jn Jn

Senior data engineer

€722/day
Paris, FR
8-15 years

Average response time: 1 hour

About Jn

Data Engineer / Tech Lead (13 ans), spécialiste des environnements
Cloudera, Spark/Structured Streaming, Databricks (AWS & Azure), Delta
Lake, Kafka et Airflow. Conçoit et opère des plateformes data cloud et
on-prem, industrialise des pipelines batch & streaming et met en place
des pratiques de qualité/observabilité. Expert performance : diagnostic
et tuning bout-en-bout, réduction de la latence et optimisation des coûts
(FinOps). Ex-développeur Java ; pratique quotidienne de Python et Java,
encadrement d'équipe et diffusion des bonnes pratiques.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • Confidentiel
    Tech lead Data Engineer
    ENERGY AND UTILITIES
    June 2023 - Today (3 years)
    Paris, France
    Tech Leadership & Architecture :

    • Pilotage transverse des équipes Data : diffusion de la culture Software Craftsmanship, des design patterns et des standards d’industrialisation (CI/CD, tests, revues de code, documentation).
    • Accompagnement méthodologique à la transition vers une organisation Data Mesh (gouvernance par domaine, responsabilisation des équipes et delivery de Data Products).
    • Conception et delivery d'un framework d'ingestion générique et d'une application transverse dédiée à la qualité de la donnée (data profiling, monitoring et alertes).

    Engineering, Migration & Big Data à l'échelle

    • Conception et optimisation de pipelines de données critiques gérant plusieurs milliards d’enregistrements par jour et plusieurs téraoctets de données (secteurs : valorisation gaz/élec, facturation, mesures).

    • Migration stratégique & modernisation d’architectures legacy Cloudera (Spark 2.4) vers un écosystème Cloud moderne (AWS S3, Glue Catalog, Delta Lake, Unity Catalog).

    Expertise Spark, Databricks & FinOps

    • Optimisation avancée de la performance Spark/Databricks (tuning de jobs, stratégies de partitionnement, réduction du shuffle, réduction drastique des temps de traitement).

    • Audits techniques et démarche FinOps : réduction drastique des coûts AWS/Databricks via le monitoring des consommations et le juste dimensionnement des clusters.

    Technologies :

    • Data & Cloud : Databricks, Spark, Delta Lake, AWS (S3, Glue, Lambda, CloudWatch, EventBridge), Unity Catalog, Cloudera (Hadoop).
    • Streaming & Orchestration : Structured Streaming, Kafka, Airflow, dbt.
    • Langages & Dev : Python, Java, SQL, GitLab CI/CD, Parquet, Avro.
    Databricks AWS S3 Java Python
  • SGSS
    Senior Data Engineer
    BANKING AND INSURANCE
    May 2021 - Today (5 years)
    Paris, France

    ➢ Projet DataHub Foundation :


    Mise en place d'une plateforme Lakehouse from scratch sur Azure, avec
    une stratégie data-centric.
    • Développement d'un outil d'ingestion multi-canaux (batch/SpringBatch, SFTP/Spring Integration, CDC/Informatica, streaming/Kafka).
    • Développement d'un moteur de processing configurable (batch &streaming) ; vues consolidées et pipelines ELT (Spark/Hive).
    • Réalisation de POC pour valider les choix techniques.
    • •Tests unitaires et d'intégration automatisés.

    ➢ Projet Îlot Reporting:


    Migration et refonte de l'application Îlot vers Azure (démantèlement du
    datalake on-prem).

    • Développement d'un outil d'ingestion Oracle → Azure.
    • Vues consolidées et normalisation via des datasets conformes aumodèle d'entreprise.
    • Datamarts métiers et exposition via API.
    • •Tests d'intégration et unitaires automatisés.

    ➢ Projet CSDR :

    Intervention sur la performance des jobs Spark et leur orchestration
    Optimisation des traitements Spark (skew, partitionnement, • cache).
    • Suppression des goulots et démarche FinOps.
    • •Réduction du workflow d'environ 10 h à ~1 h.

    Technologies utilisées:

    AKS (Azure Kubernetes Service), Databricks, Azure HDInsight (cluster Spark
    managé), ADLS Gen2, Delta Lake, Spark/Structured Streaming, Kafka,
    Airflow, Docker, Azure PostgreSQL, Azure Key Vault, Spring (IoC,
    Integration, Batch), Scala/Java/Python, PySpark, Pandas, Poetry, pyenv,
    Zeppelin, Jupyter/VS Code, Elastic Stack (Elasticsearch, Kibana),
    Grafana, Alerta.
    Cloud Azure Kubernetes Python Java Kafka
  • SCOR
    Data Engineer
    BANKING AND INSURANCE
    February 2019 - June 2021 (2 years and 4 months)
    Paris, France

    ➢ Projet SOLEM :

    Mise en place d'une plateforme de traitement temps réel pour générer des recommandations clients.
    • Construction et normalisation des données pour produire des jeux de données fiables.
    • Mise en place d'un processus d'intégration et de déploiement (CI/CD).
    • Développement de tests unitaires et d'intégration.
    • Réalisation d'audits sur les applications existantes.
    • Garantie de l'exactitude et de la disponibilité quotidiennes des données.

    Technologies utilisées:

    Scala, Java, Kafka, Spark Streaming, Tomcat, Git, Oracle, Redis, Docker, Oozie, Azure, Power BI, Jupyter, Avro, Parquet, Jenkins, Python, Kubernetes, Apache Sqoop
    Kafka Java

Recommendations

Be the first to recommend Jn

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Diplôme d'Ingénieur en Informatique
    Faculté des Sciences Tunis (FST)
    2012
    Diplôme d'Ingénieur en Informatique

Skill set

Categories