Description

Ayant 8 ans d’expérience en tant que Data Engineer. J’ai essentiellement travaillé sur les projets Spark dans un environnement Cloud et les industrialiser afin de faciliter l’exploitation des données. Mes dernières expériences professionnelles m’ont permis de développer une expertise dans le BIG DATA afin de répondre à des différentes problématiques et transformer les données brutes en insights stratégiques.

Languages

French
Native or bilingual
English
Fluent
Spanish
Basic

Workplace preferences

Can work on-site

Paris (up to 50km)

Engie
Senior Data Engineer
ENERGY AND UTILITIES
May 2024 - Today (2 years and 2 months)
Paris, France
Galileo est une application construite sur la plateforme AWS autour du framework de
développement SCALA SPARK et de divers composant AWS ( Lambda, Glue, DynamoDB,
Redshift,Kinesis) .
Cette plateforme est interconnecté avec les services Microsoft et Dataiku
✓ RÉALISATIONS
➢ Cloud AWS :
• Analyse des besoins et participation à l’identification des scénarios
d’implémentation technique sous AWS.
• Conception et implémentation de jobs ETL performants sur AWS Glue, en
utilisant Scala/Spark, pour le traitement de données volumineuses issues de
différentes sources (S3, JDBC, API).
• Formalisation des spécifications techniques et évolution de l’existant.
• Mise en place de checks de Data Quality et utilisation de Glue Catalogue
pour faciliter la gouvernance des données.
• Conception et développement d’un module flexible d’ingestion de données
écrit en Scala/Spark, capable de gérer plusieurs types de sources de
données (API REST, S3, JDBC).
• Analyse des logs CloudWatch pour l’investigation des incidents et
amélioration continue des traitements.
➢ Windmill/Traiding Auto :
• Animation de workshops avec les traders afin de recueillir les besoins
métier et comprendre les aspects fonctionnels liés à la configuration des
stratégies de traiding.
• Mise en place de l'ETL en Python : intégration de plusieurs sources de
données. à l’aide des frameworks boto3 pour l'interaction avec le service
Cloud S3 de AWS.
• Automatiser la mise en œuvre, le suivi et l’exécution de stratégies de
trading via la plateforme Windmill.
Environnement technique: AWS (Lambda, DynamoDB, S3, AWS Glue, Glue Catalogue, CloudWatch,
CloudFormation, Athena), API REST, Scala Spark, Python, Azure DevOps, Windmil, Github
Amazon Web Services Scala Spark AWS Glue API REST
AXA
Senior Data Engineer
BANKING AND INSURANCE
July 2022 - May 2024 (1 year and 10 months)
Nanterre, France
Développement from scratsh et mise en place du projet BING afin de traiter les données et
alimenter les différents cube BI dans le cadre de rationaliser et dynamiser les reportings.
✓ RÉALISATIONS
• Conception et développement des applications Ingestion des données
dans le Datalake avec du Spark/Python.
• Préparation des données : collecte et transformation des données
ingérées (PySpark).
• Mise en place des pipelines pour charger et transformer les données.
• Orchestration des pipelines avec Azure Data Factory (ADF).
• Recettage des données avec Databricks.
• Planification et exécution des workflow avec ADF.
• Participation à la rédaction des spécifications et rédaction
d’une documentation technique.
• Contribution à la refactorisation du code des applications
PySpark en appliquant les meilleures pratiques de Spark
• Développement du code YAML pour l'intégration et déploiement continu
(CI/CD) dans AZURE DEVOPS afin d’optimiser l’intégration et le
dépoilement des développements.
• Review et approbation des Pull Requests afin de les merger vers la
branche master.
• Monitoring et analyse des incidents dans la production via Azure Data
Factory.
• Faire progresser les équipes et contribution à la validation du planning
Microsoft Azure Azure DevOps PySpark Databricks Docker
PMU
consultant cloud data engineer
ENTERTAINMENT AND LEISURE
May 2020 - June 2022 (2 years and 1 month)
Paris, France
Concentrer, ordonnancer les données du PMU Puis mettre à disposition ces données pour des usages analytique type BI, Data Science, Exploration, etc.
 RÉALISATIONS
 On-Premise :
• Conception et création des applications Spark/scala from scratsh et intégration dans la chaîne CI/CD pour déployer les projets en prod via Jenkins.
• Mise en place des pipelines pour charger et transformer les données.
• Déploiement des applications sur les environnements Hors prod et prod.
• Ordonnancement et supervision via ControlM.
• Recettage des données massives via Impala.
• Run master : Monitoring et analyse des incidents dans la production.
• Maintenir et évoluer les fonctionnalités des projets Big data existants.

 Cloud AWS :
• Refonte et migration des projets de Hadoop On-Prem vers Cloud AWS.
• Rédaction des requêtes et Recettage des données massives sur AWS Athena
pour exploiter les tables.
• Intégration et déploiement continu des programmes via Gitlab CI/CD.
• Développement et supervisions de fonctions Lambda.
• Orchestration et monitoring des pipelines via Airflow.
• Extraction des données depuis Amazon Simple Queue Service (Amazon SQS).

Environnement technique : Cloudera, Spark, Scala, Hive, Hue, Impala, Jenkins, Foreman, Control-M, Dataiku, GITLAB, Jira, AWS (Airflow, Lambda, SQS, Athena, Bucket S3).
Spark Scala Amazon Web Services (AWS) Gitlab

Be the first to recommend Achraf

Help this freelancer shine by sharing your experience working together.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Licence Fondamentale en Mathématiques et Applications
Licence Fondamentale en Mathématiques et Applications
2015
Master en Ingénierie Mathématiques et Statistiques Actuarielles
Ecole Centrale de Marseille
2017

Check out Achraf's education

Data Engineer

Achraf Ben Salem

SENIOR CLOUD DATA ENGINEER

About Achraf

Experience

Recommendations

These freelancer profiles also match your criteria

Education

Skill set (17)

Categories