About Rabeh
- Design & choix dâarchitectures data
- Mise en place de data lakes, entrepÎts de données, lakehouses
- Intégration & traitement de données à grande échelle
- Spark (Scala / Python/ SQL)
- Databricks (admin, dev, CICD avec Databricks bundles)
- Azure : Data Factory, Databricks, Synapse, Fabric
- AWS : Glue, S3, EMR, EC2, Lambda
- Azure DevOps
- Terraform
- Databricks bundles
- Une approche agile
- Un planning maßtrisé
- Le respect des deadlines
French
Native or bilingual
English
Fluent
Experience
- TF1Data Engineer / Architect Data PlateformPRESS AND MEDIASeptember 2024 - Today (1 year and 10 months)Boulogne-Billancourt, FranceContexte:Accompagnement de TF1 dans la conception, la mise en place et lâindustrialisation de sa plateforme Data & Cloud pour rĂ©pondre aux enjeux de gouvernance, performance et scalabilitĂ©.Contributions principales:đ Architecture Data & Cloud :
- Design dâarchitecture sur Azure & Databricks alignĂ©e avec les besoins mĂ©tiers et techniques,
- Réalisation de POCs et benchmarks pour sélectionner les solutions les plus adaptées.
- Microsoft Fabric : test et mise en place dâun prototype de migration de workloads SQL vers Fabric, incluant la reprise de tables, la transformation des donnĂ©es et lâoptimisation des performances dans une architecture Data Lakehouse moderne.
âïž Infrastructure as Code :- DĂ©ploiement de modules Terraform pour industrialiser la plateforme:
- Mise en place d'un module Unity Catalog (Databricks) pour la gouvernance des données.
- Définition des accÚs via un module : Databricks Access Matrix.
đ CI/CD & automatisation :- CrĂ©ation de pipelines CI/CD pour dĂ©ploiements automatisĂ©s (Terraform & Databricks Bundles).
đ€ Collaboration & best practices :- Accompagnement des Ă©quipes Data & BI sur les bonnes pratiques (gouvernance, sĂ©curitĂ©, performance).
- Montée en compétences des équipes internes sur les nouveaux outils: Terraform & Spark
⥠Optimisation Data :- Amélioration des workflows de traitement Databricks.
- Optimisation continue de la plateforme pour gagner en fiabilité et en efficacité.
RĂ©sultats:- Mise en place dâune plateforme Data & Cloud robuste, sĂ©curisĂ©e et gouvernĂ©e, adaptĂ©e aux enjeux stratĂ©giques dâun grand groupe mĂ©dia.
- Automatisation des déploiements réduisant les erreurs manuelles et accélérant la mise en production.
- TotalEnergiesAWS/Azure Senior Data EngineerENERGY AND UTILITIESJune 2023 - August 2024 (1 year and 3 months)Paris, FranceContexte:Participation Ă un projet visant Ă localiser et suivre en temps rĂ©el les bornes de recharge pour vĂ©hicules Ă©lectriques, afin dâamĂ©liorer lâexpĂ©rience des conducteurs.Contributions principales:đ Infrastructure as Code : mise en place de lâenvironnement Databricks (workspaces, rĂŽles IAM, intĂ©gration avec S3 et calcul AWS EC2) via Terraform.đ CI/CD & industrialisation : automatisation avec Databricks Bundles pour dĂ©ployer les clusters, configurer les jobs et intĂ©grer le code Spark (Python).đ Architecture data : conception et implĂ©mentation du Data Lakehouse avec les diffĂ©rentes couches (Bronze, Silver, Gold) pour assurer qualitĂ© et gouvernance des donnĂ©es.⥠Pipelines de donnĂ©es :Traitement batch (Bash + Spark) exĂ©cutĂ© chaque nuit pour alimenter les tables de lâAPI de gĂ©olocalisation,Traitement temps rĂ©el pour mettre Ă jour instantanĂ©ment le statut des bornes.RĂ©sultat:Mise en place dâune plateforme data robuste, automatisĂ©e et scalable, permettant une gĂ©olocalisation fiable et une mise Ă jour en temps rĂ©el des bornes de recharge, au service des conducteurs de vĂ©hicules Ă©lectriques.
- AXAAzure Sr Data EngineerBANKING AND INSURANCEDecember 2021 - May 2023 (1 year and 6 months)Suresnes, FranceContexte:Pilotage de la migration dâun Data Lake on-premise vers Azure Cloud, avec la conception et la mise en place dâune architecture moderne de Data Lakehouse pour supporter des besoins analytiques et de business intelligence Ă grande Ă©chelle.Contributions principales:đ Ingestion & intĂ©gration des donnĂ©es : conception et implĂ©mentation de pipelines de bout en bout avec Azure Data Factory, Databricks & Spark pour une intĂ©gration fluide et automatisĂ©e.đ Transformation & reporting : dĂ©veloppement de workflows de transformation et crĂ©ation de vues mĂ©tiers fiables, garantissant un reporting de haute qualitĂ©.đ Architecture Lakehouse : mise en place dâun Delta Lakehouse sur Azure Databricks, assurant cohĂ©rence, scalabilitĂ© et gouvernance des donnĂ©es.âïž DevOps & industrialisation : adoption des pratiques Azure DevOps (Pipelines, Releases) pour automatiser les dĂ©ploiements et renforcer la collaboration entre Ă©quipes.⥠Optimisation des performances : mise en Ćuvre de techniques avancĂ©es sur Azure Databricks (optimisation Spark, Z-Order, Vacuum, gestion du Delta Lake) afin dâamĂ©liorer lâefficacitĂ© des traitements et rĂ©duire les coĂ»ts de calcul.RĂ©sultats :Migration rĂ©ussie dâun environnement on-premise vers une plateforme cloud scalable et gouvernĂ©e.AccĂ©lĂ©ration des dĂ©ploiements grĂące Ă lâautomatisation CI/CD.Mise Ă disposition dâune architecture fiable permettant des analyses et reportings de qualitĂ©, tout en rĂ©duisant les coĂ»ts dâexploitation.
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master Big DataUniversité Jean Monnet2016Master 2 Big Data
- Formation Cloudera & Certificat Spark and Hadoop DeveloperXebia2017Formation Cloudera & Certificat Spark and Hadoop Developer