About Rabah
- •Databricks Certified Data Engineer Associate
- •AWS Cloud Practitioner Certification
French
Native or bilingual
English
Native or bilingual
Arabic
Native or bilingual
Japanese
Conversational
Experience
- CodeBusters: missions chez EngieData EngineerENERGY AND UTILITIESMay 2023 - Today (3 years and 1 month)Paris, FranceConception et déploiement de pipelines de données pour l'analyse de consommation énergétique.
- •Développement de solutions ETL personnalisées avec Databricks et AWS
- •Migration de pipelines Dataiku vers Delta Lake
- •Mise en place d'ingestion quotidienne avec Autoloader
- •Optimisation des jobs Spark pour réduire les coûts de traitement
- •Automatisation des déploiements avec Terraform et CI/CD
- CodeBusters: missions chez AXA IMData EngineerBANKING AND INSURANCEMay 2022 - May 2023 (1 year)Paris, FranceCette mission fait partie d'un projet de création et maintenance d'un Datalake visant à faciliter les investissements durables.Ingestion : Mise en place de pipelines d'ingestion de données à partir d'APIs et de serveurs FTP vers Azure Gen2 Datalake, dans des formats tels que CSV, Parquet, etc. (Azure Data Factory).Transformation : À partir des données brutes dans le Datalake, transformation des fichiers bruts en tables delta. Plusieurs opérations de transformation sont effectuées, allant du nettoyage au calcul de KPI (par exemple, déterminer si un émetteur de titres est conforme aux émissions de GES) (Spark).Distribution : Cascade des données brutes vers différentes parties du système financier : titres, obligations, fonds communs de placement, etc. Cette cascade de données est gérée par le biais de plusieurs jobs orchestrés organisés via Azure Data Factory.Technologies utilisées : Scala, Python, Spark, Azure : DataLake Gen2, Azure Data Factory, Azure DevOps.
- YanportData ScientistREAL ESTATESeptember 2019 - September 2021 (2 years)Levallois-Perret, FranceDéveloppement de pipelines de données immobilières et de modèles ML de tarification.Scraping de données de portails immobilliersNettoyage et détection de valeurs aberrantes dans les données pour garantir leur qualité.Ingestion et stockage des données dans ElasticSearch pour une gestion efficace des données.Generation de rapports visualisables sous KibanaEn collaboration avec des Data Scientist; modélisation, teste et mise en production de modèles de Machine Learning (arbres de décisions avec technique de boosting - Gradient Boosting Random Forests).“Fine-tuning" de l’algorithme augmentant la précision de 90 à 96%
Recommendations
Be the first to recommend Rabah
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master of Data ScienceESGI2021Master Big Data et IA, Ingénierie informatique
- Licence, InformatiqueUniversité Paris Descartes2018Licence, Informatique
Certifications
- Databricks Certified Data Engineer AssociateDatabricks
- AWS Cloud Practitioner CertificationAWS