About Sarra
French
Native or bilingual
English
Fluent
Experience
- Renault DigitalSenior Data Engineer / Architecte GenAIMay 2025 - November 2025 (6 months)• Diagnostic et refonte d’une plateforme interne GenAI (upload → parsing → embeddings → recherche).• Stabilisation de la chaîne d’ingestion MongoDB Atlas (rebuild d’index textuels et vectoriels, contrôle de cohérence).• Conception d’une architecture cible GCP : Cloud Run + Dataflow + Airflow pour découpler les traitements.• Documentation exécutable et transfert de connaissances aux équipes Data & Cloud.Stack : Python, GCP (Cloud Run, Dataflow, BigQuery, Airflow), MongoDB, GitLab CI/CD, RAG, OpenAPI, GKE.
- Fnac DartyData engineer GCPAugust 2023 - December 2024 (1 year and 4 months)
- Migration des scripts Bash (crontab sur VM) vers Airflow, pour fiabiliser et industrialiser les traitements
- Refactorisation du code (documentation, factorisation, upgrade Python) et mise en place d’une CI/CD via GitLab & Terraform
- Optimisation de dashboards Looker Studio (clustering, splitting BigQuery) pour réduire les coûts
- Automatisation de la modération des avis clients avec un modèle LLM (Text-Bison) déployé via Cloud Function
- BPCE Infogérance & TechnologiesData Engineer & Tech Lead Streaming FactoryDecember 2017 - April 2023 (5 years and 4 months)
- Rôles successifs :
1. Création & Gestion de la Streaming Factory (2021 – 2023)Développement de pipelines temps réel & standardisation des bonnes pratiquesMise en production d’architectures distribuées (Kafka, NiFi)Recrutement et montée en compétence des Data Engineers sur le streamingStack : Kafka, NiFi, Solr, Hive, GCP, Java, Python2. Data Engineer / Tech Lead – BPCE Référentiels, Financement & Trade (2021 – 2022)Accompagnement des équipes métiers sur Hadoop, de la conception à la mise en œuvreScripts PySpark pour analyser des fichiers XML et stocker les données dans HiveDéveloppement et optimisation des flux d’alimentation du Datalake RéférentielsStack : CDP, Hive, Spark, Kafka (Python lib), PySpark, CI/CD (XLDeploy, Jenkins)3. Industrialisation & Best Practices – BPCE Assurance Vie (2019 – 2020)Industrialisation des modèles data science (score d’octroi)Mise en place de templates réutilisables (versioning, logging, packaging)Collaboration aux guidelines Groupe pour l’industrialisation des modèlesStack : Python, PySpark, Jupyter, Git, Cookie Cutter4. Data Engineer – Trade & Treasury (2019 – 2020)Transfert de données vers HDFS et mise en prod d’algorithmes de fraude (scoring, profilage)Stack : HDP, Hive, Python, PySpark, Git, CI/CD5. Data Engineer – Full Trade Monitoring (2018 – 2019)Mise en place d’un Datalake (Kafka, Hive, Solr, PySpark) et d’un moteur de recherche FlaskCollaboration étroite avec Data Science & métiers
Recommendations
Be the first to recommend Sarra
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master en Big Data et Machine LearningUniversité Paris 82017- Cours connexes : Intelligence artificielle, plateformes Big Data, sécurité informatique, algorithmes avancés} - Réalisation d'un mémoire portant sur la prédiction de la maladie de Parkinson à l'aide de données provenant de smartphones (Data Set Kaggle), SVM, WEKA, Python, (publications ACM)
- Licence,Université Paris 82015Licence en Conception, Développement et Validation des Applications
Certifications
- Google Cloud Certified Professional Data EngineerGoogle Cloud2023