You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Marwan HamzaouiMH

Marwan Hamzaoui

Data Engineer | ETL, Python, SQL, Automatisation

€300/day
Paris, FR
0-2 years

Average response time: 1 hour

About Marwan

Data Engineer, j'aide les équipes et les PME à fiabiliser et automatiser leurs flux de données : collecte, nettoyage, transformation et mise à disposition de données exploitables pour l'analyse et le reporting.

Concrètement, je conçois des pipelines ETL en Python et SQL, j'automatise les tâches répétitives (extraction d'API, traitement de fichiers, alimentation de bases) et je structure vos données pour qu'elles soient propres et exploitables. Je travaille au quotidien avec Python, SQL, Spark et Docker dans un contexte data réel, de l'ingestion de données externes jusqu'à la modélisation.

Ce qui me différencie : un code propre, documenté et que vous pouvez reprendre, une vraie rigueur sur la qualité des données, et une communication claire, j'explique chaque choix technique plutôt que de livrer une boîte noire.

Types de missions sur lesquelles j'interviens : création ou refonte de pipelines ETL, automatisation de traitements de données, scripts d'extraction et d'intégration, nettoyage et préparation de jeux de données, premiers traitements distribués avec Spark.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • CNP Assurances
    Data Engineer / Data Scientist
    BANKING AND INSURANCE
    September 2025 - Today (10 months)
    Issy-les-Moulineaux, France
    Data Engineer & Data Scientist au sein de CNP Assurances. Je conçois des pipelines de données from scratch sur des projets à fort volume, au service de modélisations actuarielles avancées.

    🔹 Data Engineering :
    - Construction from scratch d'un pipeline d'extraction de données climatiques massives (API Copernicus, ERA5, CMIP6) : ingestion, traitement de fichiers NetCDF, agrégation spatiotemporelle sur la France et l'Allemagne (Python, PySpark, SQL)
    - Génération de données synthétiques pour exploiter des données assurantielles confidentielles : benchmark de 7 méthodes (SDV/GaussianCopula, CTGAN, TVAE, TabDDPM, PrivBayes…)

    🔹 Data Science appliquée (ce que mes pipelines alimentent) :
    - Modélisation GLM Binomial Négatif de la surmortalité estivale (Heat Index), comparaison XGBoost/Random Forest, projections actuarielles à horizon 2100 (5 modèles climatiques, 3 scénarios SSP)
    - Analyse exploratoire de données contrats et assurés, modèle de risques concurrents mortalité/rachat (Random Survival Forest)

    Environnement exigeant : données sensibles, rigueur et traçabilité.

    En parallèle : Master 2 Data Science/ Data Engineer, Université Paris 1 Panthéon-Sorbonne (Spark, architectures de données, Docker, CI/CD).
    Python SQL ETL Machine learning Git

Recommendations

Be the first to recommend Marwan

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Categories