About Amine
French
Native or bilingual
English
Fluent
Experience
- Caisse des dépôtsLead Data EnginneerBANKING AND INSURANCEJanuary 2024 - January 2026 (2 years)Paris, FrancePilotage et industrialisation des solutions data pour les périmètres monétique, investissement bancaire et reporting réglementaire (Commission européenne)• Cadrage fonctionnel et rôle de référent technique data (Workshops, POCs, Coordination équipes métier et techniques)• Conception et mise en œuvre d’architectures Lakehouse pour des usages analytiques et réglementaires• Développement et industrialisation de pipelines Big Data end-to-end (Spark, Python, SQL), avec automatisation des flux• Mise en place de processus CI/CD, Quality Gates et bonnes pratiques de Python craftsmanship• Gestion du RUN (MCO), résolution d’incidents, fiabilisation et amélioration continue des chaînes de traitement• Mise en oeuvre de la data privacy : anonymisation, catalogage des données sensibles et gouvernance associéeEnvironnement technique :Spark, Python, SQL, Data Lake, Data Vault, Data Marts, Hive, HDFS, Ranger, Atlas, Jenkins, CloudBees, Bitbucket, SonarQube, Control-M, SQL Server, Power BI, Tableau, Dataiku, Alteryx
- GRDFData engineerENERGY AND UTILITIESSeptember 2022 - December 2023 (1 year and 3 months)Paris, FranceProjet Gazpar – Projet Gazpar – Valorisation et sécurisation de la chaîne de traitement des données IoT issues de 11 millions de compteurs communicants.● Conception et développement de pipelines d’ingestion massive pour l’historisation des trames IoT (protocole Wize 169 MHz) vers un Data Lake AWS● Mise en œuvre d'une architecture Compute isolée et scalable utilisant AWS EKS (Fargate) et Lambda pour le parsing et l'agrégation en temps réel des index de consommation● Construction de datasets fiables sur S3 pour les besoins de BI et de Data Science● Orchestration des pipelines avec Airflow et automatisation complète de l’infrastructure via Terraform (IaC) dans des workflows CI/CD.● Optimisation des performances et gestion des volumes importants● Utilisation ponctuelle de CloudWatch et la stack ELK pour le monitoring et l’observabilité de la chaîne IoTEnvironnement technique:Python, SQL, PySpark, Spark, IOT Wize (169 MHz), AWS (S3, EKS Fargate, Lambda, KMS, VPC PrivateLink, IAM), Terraform, Airflow, Jenkins, GitLab, ELK, CloudWatch, Redis, Dataiku
- Decathlon SEData engineerSPORTSAugust 2021 - August 2022 (1 year and 1 month)Lille, FranceIndustrialisation et exploitation d’une plateforme Data AWS dédiée à l’analyse des transactions de vente et d’achat à l’échelle mondiale.Travaux réalisés :Analyse des besoins métiers (ventes, achats, performance économique)Centralisation des données transactionnelles au sein d’un Data Lake S3Migration et optimisation de traitements Talend vers des pipelines SparkDéveloppement de pipelines Spark/Databricks pour le traitement massifsMise en place de pipelines automatisés (Lambda, Airflow) et standardisation des traitementsOptimisation des performances et gestion de la volumétrieAutomatisation des contrôles et des traitements data via AWS LambdaAccès ad-hoc aux données du Data Lake via Amazon AthenaExposition des données via Athena/Redshift pour l’analytics et la BIDocumentation technique et fonctionnelle des pipelines et modèles de donnéesEnvironnement technique :Python, PySpark, SQL, AWS (S3, Lambda, Athena, Redshift), DataBricks, Kafka, Cassandra, CI/CD, Airflow, Jenkins, Git,Github, Jira, Confluence
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master en Big Data et Data ScienceUniversité de Caen Normandie2020
- Licence Maths & InfosUniversité de Montpellier 22018