You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Merwan Amar ChelouahMA

Merwan Amar Chelouah

Cloud Data Engineer

€500/day
Paris, FR
3-7 years

Average response time: 1 hour

About Merwan Amar

Data Engineer Cloud avec expertise en architectures AWS scalables, Modern Data Stack (Snowflake + dbt) et intégration de solutions d’IA générative.

Je conçois et industrialise des plateformes data robustes tout en développant des cas d’usage GenAI connectés aux données d’entreprise (RAG, assistants internes, automatisation documentaire).

Expertise technique :
• AWS (Lambda, Step Functions, EventBridge, SQS, SNS, ECS, S3)
• Snowflake & dbt (modélisation, transformation, data quality)
• Architectures event-driven & CI/CD
• IA Générative : LangChain, modèles LLM (Bedrock), pipelines RAG
• Industrialisation, observabilité et gouvernance des flux data

Positionnement : à l’intersection Data Platform & GenAI, pour transformer les données d’entreprise en produits analytiques et intelligents.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km), Lyon (up to 10km), Toulouse (up to 10km), Nice (up to 10km)

Experience

  • Sanofi
    Software Data Engineer & ML Engineering
    PHARMACEUTICALS INDUSTRY
    June 2026 - Today (1 month)
    Toronto, Canada
    Au sein du Centre d'Excellence IA de Sanofi, je conçois et opère les plateformes et pipelines de données qui alimentent les modèles ML et produits IA en production, pour la chaîne de fabrication et d'approvisionnement mondiale.

    Conception de pipelines de données end-to-end pour des cas d'usage IA/ML : feature engineering, constitution des jeux de données d'entraînement et pipelines d'inférence.
    Mise à disposition de données fiables et de haute qualité sur l'ensemble du cycle de vie des modèles.
    Collaboration étroite avec les Data Scientists sur le développement, la mise en production et le monitoring des modèles.
    Optimisation des systèmes de données pour des traitements à grande échelle et en temps réel sur AWS.
    Mise en place de la CI/CD et de l'automatisation des pipelines data et ML (MLOps).
    Garantie de la qualité, de la gouvernance et de la reproductibilité des données à travers les workflows ML.
    Contribution à des fondations data robustes et scalables dans un contexte de santé mondial.

    Stack : Python, SQL, Spark, Snowflake, Airflow, dbt, Terraform, Docker
    Python Amazon Web Services CI/CD Management Snowflake Airflow
  • Transdev
    Cloud Data Engineer
    TRANSPORTATION
    September 2024 - January 2026 (1 year and 4 months)
    Paris, France
    Pilotage de la conception et de la mise en œuvre d’architectures data cloud-native et orientées événements afin de soutenir des solutions analytiques scalables et fiables à l’échelle de l’organisation.

    Principales responsabilités et réalisations :

    Conception et développement de pipelines de données sur AWS, en utilisant Lambda, Step Functions, EventBridge, SQS et SNS, afin de permettre l’ingestion, la transformation et la mise à disposition fluide de données sous différents formats (CSV, JSON, Parquet) vers S3, bases de données relationnelles, APIs REST et Snowflake.

    Développement et déploiement d’une plateforme Datalab en self-service (React + Node.js), hébergée sur AWS (ECS, Route 53, ALB), permettant aux Data Scientists, Business Analysts et équipes métiers de provisionner des environnements isolés avec un accès gouverné aux jeux de données issus du DataHub d’entreprise.
    → Réduction drastique du délai de mise à disposition des données — de plusieurs semaines à quelques heures — accélérant l’expérimentation, le prototypage et le time-to-insight au sein de l’organisation.

    Automatisation du provisionnement d’infrastructure via AWS CDK (Infrastructure as Code) et mise en place de pipelines CI/CD robustes avec Jenkins afin d’industrialiser et fiabiliser les déploiements.

    Pilotage de la priorisation du backlog architecture et livraison d’études d’architecture de bout en bout ainsi que de proof-of-concepts (POC) pour des initiatives data stratégiques.

    Rédaction de blueprints d’architecture détaillés, de documentation technique et de high-level designs afin de guider les implémentations et garantir l’alignement avec les standards d’entreprise.

    Contribution hands-on sur des sujets techniques clés tout en accompagnant les tech leads dans la définition et l’application des bonnes pratiques d’ingénierie au sein de la plateforme data.

    Promotion d’une approche data-first, avec un fort accent sur l’automatisation.
    Amazon Web Services Snowflake Infra as Code External API integration CI/CD Management
  • Société Générale
    Data Engineer / Data Scientist – Credit Risk Analytics
    BANKING AND INSURANCE
    February 2022 - September 2024 (2 years and 7 months)
    Paris, France
    Pilotage des processus d’intégration de données de bout en bout, avec conception et orchestration des pipelines d’ingestion des données Crédit du Nord en utilisant Python, SQL et des frameworks ETL, en garantissant l’intégrité des données et leur alignement avec l’architecture risque de Franfinance.

    Évaluation et mitigation des impacts systémiques sur l’ensemble de la chaîne de valeur des données, incluant la dérive des modèles (model drift), la stabilité des variables (feature stability) et les problématiques de traçabilité des données (data lineage) affectant les modèles réglementaires (PD, LGD, EAD).

    Pilotage de campagnes de tests de régression, de backtesting et de stress testing afin de valider la performance des modèles post-intégration, en conformité avec les exigences Bâle III/IV et les cadres de validation interne.

    Construction de cadres d’analyse du risque réglementaire permettant de quantifier les impacts en capital et en tarification liés à l’absorption du portefeuille, en s’appuyant sur des métriques avancées (RWA, coussins de capital) pour soutenir la stratégie de pricing et la prise de décision.

    Automatisation des processus de risque opérationnel et des pipelines de reporting en environnement Unix (scripts shell), avec des traitements en aval sous SAS et Python, réduisant le temps d’exécution et l’intervention manuelle de plus de 60 %.

    Rôle d’interface clé entre les équipes Data Science, Risque et IT afin d’assurer la traçabilité des données, la conformité aux exigences de gouvernance et la préparation aux audits des modèles tout au long du cycle de vie du projet.
    Python Data integration (ETL, ELT and data warehousing) Database Management (e.g., SQL, NoSQL) Data Integrity and Governance Machine learning

Recommendations

Be the first to recommend Merwan Amar

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master's Degree in Computer Science, Spécialisation Architecture Solution
    CentraleSupélec
    2025
    Master's Degree in Computer Science
  • Master in Data Science and Quantitative Finance (MOSEF)
    Université Paris 1 Panthéon Sorbonne
    2020
    Master in Data Science and Quantitative Finance (MOSEF)

Skill set

Categories