About Sidi
English
Native or bilingual
French
Native or bilingual
Experience
- Sanofi AcceleratorSanofi - Data & AI EngineerPHARMACEUTICALS INDUSTRYApril 2026 - Today (2 months)Paris, FranceContexte :Plateforme GenAI pour la génération automatisée de documents réglementaires (Clinical Trial Documents) dans l'industrie pharmaceutique. Environnement de production critique avec exigences strictes de traçabilité, sécurité et conformité.Réalisations :Conception et développement de l'architecture RAG end-to-end : parsing de documents, chunking, embedding, vector store (Pinecone, S3 Vectors), retrieval et génération LLMIntégration de modèles LLM en production : Azure OpenAI (GPT-4o), AWS Bedrock (Claude)Architecture d'observabilité des pipelines LLM avec Weave/W&B : tracing step-by-step pour les équipes Data ScienceOptimisation des performances : remplacement FAISS par S3 Vectors pré-calculés, réduction des coûts de ~70%Refactoring de l'architecture backend vers DDD-light : résolution de 12 findings d'auditRédaction de specs techniques (design doc 16 sections) alignant Data Science, Data Engineering et BackendConfiguration multi-environnements (dev/test/prod) avec Pinecone et EventBridgeStack technique :Python 3.12 · FastAPI · AWS (Lambda, Step Functions, ECS, S3, Bedrock) · Azure OpenAI · LangChain · Pinecone · Weave/W&B · Terraform · Docker · GitHub Actions · Snowflake · NestJS · React · TypeScript
- BNP Paribas CIBSenior Data & AI EngineerBANKING AND INSURANCEMay 2022 - February 2026 (3 years and 9 months)Pantin, FranceIntervention sur les projets Data Engineering et IA Générative de l'équipe IT Trade Finance, sur les périmètres AML (Anti-Money Laundering) et Fraud Detection.📊 Projet Data — Pipelines AML & Fraud DetectionDéveloppement de pipelines end-to-end traitant des millions de transactions : ETL, transformation, scoring et génération d'alertes.→ Optimisation Spark (tuning avancé, gestion du data skew)→ Intégration Quantexa pour graphes relationnels et enrichissement contextuel des alertes→ Déploiement cloud privé avec Kubernetes, Skaffold, Kustomize👥 Mise en place et structuration d'une nouvelle équipe Data EngineeringPilotage de la création from scratch d'une équipe data de 7+ personnes : définition des besoins, recrutement, onboarding et montée en compétences.→ Création et scaling d'une équipe offshore en Inde (4 Data Engineers, 1 DevOps, 1 BA, 1 PO)→ Mise en place des standards de développement, patterns architecturaux et bonnes pratiques→ Encadrement technique au quotidien : code reviews, décisions architecturales, mentoring🤖 Projet IA Générative — Plateforme RAG d'assistance documentaireConception et déploiement d'une plateforme conversationnelle permettant d'interroger en langage naturel toute la documentation projet (Confluence, Jira, Elasticsearch, emails).→ Réduction de 90% du temps de recherche d'information pour les équipes→ Pipeline de vectorisation multi-sources, base de données vectorielle, orchestration LLM via LangChain avec prompt engineering et stratégies de retrieval optimisées→ API backend Python/FastAPI, déploiement KubernetesStack : Python, LangChain, LangGraph, FastAPI, Elasticsearch, Vector DB, Scala, Spark, Kafka, Kubernetes, AWS, S3, Quantexa, ELK, RAG
- Bedrock streamingSenior Data engineerPRESS AND MEDIAJanuary 2022 - May 2022 (4 months)Lyon, FranceMission freelance au sein de l'équipe A/B Testing, sur les plateformes de streaming M6+, RTL+ Hungary et Videoland.📊 Pipelines Data multi-plateformesConception et développement de pipelines temps réel et batch pour l'expérimentation et l'analytics sur plusieurs plateformes de streaming internationales.→ Ingestion de volumes élevés d'événements utilisateur via AWS Glue, EMR et Athena→ Workflows scalables avec Spark et Databricks pour fiabiliser les métriques d'expérimentation→ Automatisation de l'infrastructure via Terraform et pipelines CI/CD (Jenkins, GitHub Actions)Stack : AWS (Glue, EMR, Athena), Terraform, Python, Scala, Spark, Databricks, Airflow, Docker, Jenkins, GitHub Actions, Iceberg, dbt
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master informatiqueSorbonne université (ex Université Pierre et Marie Curie)2018
Certifications
- Machine learningStanford University - Coursera2018
- Hadoop Platform and Application FrameworkUniversité San Diego - Coursera2018