Description

Data Engineer Cloud avec expertise en architectures AWS scalables, Modern Data Stack (Snowflake + dbt) et intégration de solutions d’IA générative.

Je conçois et industrialise des plateformes data robustes tout en développant des cas d’usage GenAI connectés aux données d’entreprise (RAG, assistants internes, automatisation documentaire).

Expertise technique :

• AWS (Lambda, Step Functions, EventBridge, SQS, SNS, ECS, S3)

• Snowflake & dbt (modélisation, transformation, data quality)

• Architectures event-driven & CI/CD

• IA Générative : LangChain, modèles LLM (Bedrock), pipelines RAG

• Industrialisation, observabilité et gouvernance des flux data

Positionnement : à l’intersection Data Platform & GenAI, pour transformer les données d’entreprise en produits analytiques et intelligents.

Industry field of expertise

Languages

French
Native or bilingual
English
Fluent

Workplace preferences

Can work on-site

Paris (up to 50km), Lyon (up to 10km), Toulouse (up to 10km), Nice (up to 10km)

Sanofi
Software Data Engineer & ML Engineering
PHARMACEUTICALS INDUSTRY
June 2026 - Today (2 months)
Toronto, Canada
Au sein du Centre d'Excellence IA de Sanofi, je conçois et opère les plateformes et pipelines de données qui alimentent les modèles ML et produits IA en production, pour la chaîne de fabrication et d'approvisionnement mondiale.

Conception de pipelines de données end-to-end pour des cas d'usage IA/ML : feature engineering, constitution des jeux de données d'entraînement et pipelines d'inférence.
Mise à disposition de données fiables et de haute qualité sur l'ensemble du cycle de vie des modèles.
Collaboration étroite avec les Data Scientists sur le développement, la mise en production et le monitoring des modèles.
Optimisation des systèmes de données pour des traitements à grande échelle et en temps réel sur AWS.
Mise en place de la CI/CD et de l'automatisation des pipelines data et ML (MLOps).
Garantie de la qualité, de la gouvernance et de la reproductibilité des données à travers les workflows ML.
Contribution à des fondations data robustes et scalables dans un contexte de santé mondial.

Stack : Python, SQL, Spark, Snowflake, Airflow, dbt, Terraform, Docker
Python Amazon Web Services CI/CD Management Snowflake Airflow
Transdev
Cloud Data Engineer
TRANSPORTATION
September 2024 - January 2026 (1 year and 4 months)
Paris, France
Pilotage de la conception et de la mise en œuvre d’architectures data cloud-native et orientées événements afin de soutenir des solutions analytiques scalables et fiables à l’échelle de l’organisation.

Principales responsabilités et réalisations :

Conception et développement de pipelines de données sur AWS, en utilisant Lambda, Step Functions, EventBridge, SQS et SNS, afin de permettre l’ingestion, la transformation et la mise à disposition fluide de données sous différents formats (CSV, JSON, Parquet) vers S3, bases de données relationnelles, APIs REST et Snowflake.

Développement et déploiement d’une plateforme Datalab en self-service (React + Node.js), hébergée sur AWS (ECS, Route 53, ALB), permettant aux Data Scientists, Business Analysts et équipes métiers de provisionner des environnements isolés avec un accès gouverné aux jeux de données issus du DataHub d’entreprise.
→ Réduction drastique du délai de mise à disposition des données — de plusieurs semaines à quelques heures — accélérant l’expérimentation, le prototypage et le time-to-insight au sein de l’organisation.

Automatisation du provisionnement d’infrastructure via AWS CDK (Infrastructure as Code) et mise en place de pipelines CI/CD robustes avec Jenkins afin d’industrialiser et fiabiliser les déploiements.

Pilotage de la priorisation du backlog architecture et livraison d’études d’architecture de bout en bout ainsi que de proof-of-concepts (POC) pour des initiatives data stratégiques.

Rédaction de blueprints d’architecture détaillés, de documentation technique et de high-level designs afin de guider les implémentations et garantir l’alignement avec les standards d’entreprise.

Contribution hands-on sur des sujets techniques clés tout en accompagnant les tech leads dans la définition et l’application des bonnes pratiques d’ingénierie au sein de la plateforme data.

Promotion d’une approche data-first, avec un fort accent sur l’automatisation.
Amazon Web Services Snowflake Infra as Code External API integration CI/CD Management
Société Générale
Data Engineer / Data Scientist – Credit Risk Analytics
BANKING AND INSURANCE
February 2022 - September 2024 (2 years and 7 months)
Paris, France
Pilotage des processus d’intégration de données de bout en bout, avec conception et orchestration des pipelines d’ingestion des données Crédit du Nord en utilisant Python, SQL et des frameworks ETL, en garantissant l’intégrité des données et leur alignement avec l’architecture risque de Franfinance.

Évaluation et mitigation des impacts systémiques sur l’ensemble de la chaîne de valeur des données, incluant la dérive des modèles (model drift), la stabilité des variables (feature stability) et les problématiques de traçabilité des données (data lineage) affectant les modèles réglementaires (PD, LGD, EAD).

Pilotage de campagnes de tests de régression, de backtesting et de stress testing afin de valider la performance des modèles post-intégration, en conformité avec les exigences Bâle III/IV et les cadres de validation interne.

Construction de cadres d’analyse du risque réglementaire permettant de quantifier les impacts en capital et en tarification liés à l’absorption du portefeuille, en s’appuyant sur des métriques avancées (RWA, coussins de capital) pour soutenir la stratégie de pricing et la prise de décision.

Automatisation des processus de risque opérationnel et des pipelines de reporting en environnement Unix (scripts shell), avec des traitements en aval sous SAS et Python, réduisant le temps d’exécution et l’intervention manuelle de plus de 60 %.

Rôle d’interface clé entre les équipes Data Science, Risque et IT afin d’assurer la traçabilité des données, la conformité aux exigences de gouvernance et la préparation aux audits des modèles tout au long du cycle de vie du projet.
Python Data integration (ETL, ELT and data warehousing) Database Management (e.g., SQL, NoSQL) Data Integrity and Governance Machine learning

Check out Merwan Amar's experience

Be the first to recommend Merwan Amar

Help this freelancer shine by sharing your experience working together.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Master's Degree in Computer Science, Spécialisation Architecture Solution
CentraleSupélec
2025
Master's Degree in Computer Science
Master in Data Science and Quantitative Finance (MOSEF)
Université Paris 1 Panthéon Sorbonne
2020
Master in Data Science and Quantitative Finance (MOSEF)

Cloud Engineer & Architect

Merwan Amar Chelouah

Cloud Data Engineer

About Merwan Amar

Experience

Recommendations

These freelancer profiles also match your criteria

Education

Skill set

Categories