You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mohammed T.MT

Mohammed T.

Senior Data engineer (Python-SQL-Spark-Scala)

€725/day
Paris, FR
3-7 years

Average response time: 1 hour

About Mohammed

Bienvenue sur mon profil Malt 🙂!

Data engineer avec plus de 6 ans d'expériences, j'ai travaillé pour diverses grandes entreprises telles que le Groupe Seb, Sanofi, FDJ, Atos.
Ma mission est d'aider mes clients à concevoir et développer leur modèle de données, pipelines de données et l'architecture de données🛢⚙📊.

Ce que je peux faire pour vous autour de la data de manière industrielle:

👉 Ingestion de la donnée
J'implémente des jobs/pipelines qui vont ingérer vos données quelque soit le volume et le format(csv, json, avro...), je peux aussi ingérer vos données en étant conforme à la RGPD.

👉Transformation et Agrégation de la donnée
J'implémente des jobs/pipelines qui vont filtrer, nettoyer, transformer, enrichir vos données afin d'offrir de la donnée exploitable.
J'implémente aussi des calculs d'agrégation pour vos KPI.

👉Exposition de la donnée
Des scripts seront industrialisé pour exposer vos données sous forme de vue ou table SQL, Hive(ces tables constituerons votre Datawarehouse)

👉Architecture de données
Je conseille et accompagne pour la mise en place de votre data plateforme(architecture de stockage et de traitement)

👉Industrialisation data science

N'hésitez pas à me contacter 🙂!





  • French

    Native or bilingual

  • English

    Native or bilingual

Can work on-site
Paris (up to 20km), Lyon (up to 20km)

Experience

  • Groupe Seb
    Data engineer
    ENTERTAINMENT AND LEISURE
    April 2021 - Today (5 years and 2 months)
    Au sein de l'équipe PCM (Professional coffee machine) je suis amené à concevoir et implémenter des pipelines data et jobs spark afin d'alimenter le datawarhouse et construire des Dashboard/rapports dataviz pour les différents clients qui utilsent ces machines à café pro.

    👉Data engineering tech lead
    • Interface avec l’équipe backend pour gérer les changements au niveau de la source de données et anticiper les impacts techniques
    • Accompagnement des nouveaux DE entrants
    • Rédaction des technical story
    • Pair programming
    • Révision des pull request
    • Release delivery (bran

    👉Data pipelines
    • Design et développement des jobs spark d’ingestion pour les télémétries et les twins et les données de référence
    • Design et développement des jobs spark(mode full-process) de transformation selon les règles de gestion métier et exposition via des tables SQL/Synapse pour les Dashboard PBI
    • Design et développement job spark pour l’entité management
    • Design et Développement des jobs spark de transformation (mode delta-process) (pipeline d’initialisation + pipeline delta-process)
    • Design et Développement des pipelines data pour les tables agrégées : pipeline préparation golden-data, pipeline calcul d’agrégation (Daily, Monthly, Weekly), pipeline d’exposition des tables agrégées
    • Optimisation des jobs de transformation

    👉Data stack
    • Intégration de Azure Synapse avec l’ARM sur la platforme de données
    • Upgrade des versions spark (projet spark + run-time spark)
    • Dimensionnement du Sparkpool selon le cas d’usage pour le run-time des pipelines data
    • Configuration du transfert des logs spark vers log Analytics
    • Mise en place du monitoring pour les pipelines data/spark
    • Intégration delta Lake au niveau des jobs spark et implémentation de la pipeline Vaccum
    Spark Scala Microsoft Azure Azure DevOps PySpark Git Gitflow CI/CD ARM Azure Synapse
  • Ynov Campus
    Juré et évaluateur - Projet de fin d'études (Data & AI)
    EDUCATION AND E-LEARNING
    August 2023 - September 2023 (1 month)
    J'ai intervenu en tant que professionnel de la donnée afin d'évaluer les soutenances des projets de fin d'études (Bac+5) Data et intelligence artificiel
  • Française des Jeux
    Data engineer
    ENTERTAINMENT AND LEISURE
    January 2019 - March 2021 (2 years and 2 months)
    Data Engineer au sein de l’équipe DataLake

    👉Data Pipelines
    👉👉Traitement Batch :
    • Design et développement des jobs d’ingestion Spark/scala
    • Design et développement des jobs Spark/scala de la RGPD (Génération de clés, cryptage, droit à l’oublie)
    • Design et Développement des DAG Airflow pour les jobs d’ingestion (RGPD conforme)
    • Développement des formules Salt pour la création des Tables et Vues Hive
    • Développement des formules Salt pour la création des Tables Phoenix/Hbase
    • Développement du job Spark pour le compactage des blocs HDFS de petite taille
    👉👉Traitement streaming :
    • Développement des workflow Nifi pour la collecte des events (données référentielles sport) puis buffering dans topic kafka et traitement en Spark streaming ainsi que la restitution dans Hbase
    • Développement d’un job Spark streaming pour l’enrichissement des alertes sport par les données référentielles

    👉Data stack
    Modélisation et implémentation de la couche batch du DataLake sur l’env de DEV
    • Modélisation et implémentation de la plateforme data science (Jupyter, Hue) sur l’env de DEV
    • Modélisation et implémentation de la couche speed(nifi/kafka/elastic) du DataLake sur l’env de DEV et Pre-prod
    • Etude et Migration du DataLake Prod (couche batch) vers un nouveau VLAN
    • Développement/MEP des Formules Salt pour l’arrêt et démarrage de l’ensemble des services de la couche batch
    • Développement/MEP des formules Salt pour le test unitaire des services de la couche batch du DataLake
    • Troubleshooting et Correction des Anomalies et incidents

    👉Industialisation Data science
    • Développement d’un modèle de projet data science pyspark industrialisé (projet modulaire + test unitaire + CI/CD)
    • Démo pour les data scientiste sur l’industrialisation de la Data science
    Spark PySpark Scala setuptools Python Anaconda Hadoop Apache Kafka ELK RGPD Conformité RGPD Openstack Infrastructure as code Saltstack logisland Hive Gitlab CI/CD Git Gitflow Docker

Recommendations

Be the first to recommend Mohammed

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master 2 Data mining
    Université lyon 2
    2017
  • Ingénieur génie informatique - option génie logiciel
    Ecole nationale d'informatique et d'analyse des systèmes
    2016

Certifications

Skill set

Categories