About Mrani Alaoui
English
Fluent
Arabic
Native or bilingual
Experience
- ITNOVEMSenior Data EngineerTRANSPORTATIONOctober 2021 - June 2023 (1 year and 8 months)Paris, FranceRefonte des chaines de collecte et de mise à disposition des données dans le Datalakepour les besoins d’analytics de l’entité voyage (connaissance client)
- Reprise de l’existant : analyse des datamodels et des notebook pyspark existants, exploration des datasets générés
- Recueil des besoins d’évolution sur l’existant et des anomalies remontées par le métier
- Conception et validation de la solution technique de refonte via l’implémentation de batchs Spark quotidiens sur Databricks
- Rédaction des spécifications technico fonctionnelles des jobs à implémenter et documentation des schémas de flux sur Confluence
- Implémentation des pipelines d’ingestion en deux temps : première version rapide en notebook sur databricks et ensuite industrialisation en application Spark Scala avec tests unitaires et d’intégration
- Collecte et transformation des données brutes en Json/csv/parquet
- Structuration du datalake en trois couches raw, bronze et gold au format Delta afin de minimiser le temps de mise à disposition des données du flux quotidien ainsi que l’initialisation des datasets les plus volumineux (3milliards de lignes)
- Modélisation des traitements en incrémental (vs reprise quotidienne de l’historique) afin de minimiser le temps de traitement (passage de 12h en Talend à 10 minutes de batch Spark toutes les heures)
- Agrégation et exposition des données enrichies dans le datawarehouse (Azure Synapse) sous forme de vues SQL, amélioration des performances d’écriture dans Synapse à travers la création de tables CTAS (passage de 2h à 5 secondes en temps d’indisponibilité des vues métier)
- Amélioration de la chaine CI : mise en place des versions applicatives, initialisation de Nexus et déclaration des pipelines de build dans Jenkins, instauration des revues de code et des merge requests obligatoires
- Monitoring technique et opérationnel sur Datadog : suivi d’exécution des jobs spark, et monitoring par dimensions du volume de données mises à disposition
- Initialisation de l’environnement de Benchmark pour les stress tests et la qualification des performances en iso Prod
- Accompagnement de l’équipe, onboarding des nouveaux arrivants, pair programming.
- KeringTech LeadLUXURY GOODSJune 2019 - October 2021 (2 years and 4 months)Paris, FranceDatalake sur AWS
- Pipelines d'ingestion et de traitement des données brutes et normalisées (Apache NiFi / Spark / Cassandra / S3)
- Optimisation fonctionnelle et technique des batch Spark
- Amélioration des dépendances et du scheduling des jobs
- Mise à disposition de données enrichies/pré-agrégées
- Migration du scheduling sur Airflow
Reporting operationnel- Encadrement des use cases (études préliminaires, élaborations des spécifications fonctionnelles/techniques, suivi du développement et des phases d'UAT)
- Mise en place d'une solution de découverte de la donnée basée sur Apache Druid et Superset
- Automatisation d'un mécanisme de reporting basé sur SQL qui offre l'indépendance aux data analysts
- Accompagnement des utilisateurs du datalake (compréhension de la donnée, best practices de développement et d'exploitation des plateformes)
Transverse- Gestion de la roadmap technique (dette technique, upgrade des services, initiation de POCs, ...)
- Participation aux ateliers structurant du datalake (gouvernance des données, offre de service)
- Coordination technique transverse de 3 équipes (dont 2 au sein du datalake)
- Support niveau N2 et N3
- KeringTech LeadLUXURY GOODSJuly 2017 - June 2019 (1 year and 11 months)Paris, FranceCollecte et mise à disposition de données opérationnelles enrichies
- Participation à l'architecture technique
- Ingestion de données structurées et semi structurées avec Apache NiFi
- Mise en place de pipelines d'enrichissement en lambda avec Spark scala (real time et batch)
- Persistance des données enrichies dans Cassandra + indexation dans Apache Solr
- Redistribution des données brutes et enrichies (Data Hub) dans kafka et exposition via api Node JS
- Garantie de la qualité des données exposées (Tests applicatifs / Data quality checks / Monitoring des flux)
- Suivi et gestion de la prod, gestion du versionning (applicatif et celui de la donnée)
- Campagnes de stress tests sur la plateforme on Premise
- Migration progressive des services (Cassandra/Spark/Solr/Redis) et des applicatifs sur AWS
- Implémentation RGPD
- Animation agile et coordination de l'équipe
- Mise en place des scénarios backup/restore
Recommendations
Be the first to recommend Mrani Alaoui
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4