About Shahul
- Architecture Data Scalable : Design de plateformes modernes sur Snowflake, AWS, GCP, Azure
- Data Lakehouse & Medallion : Couches Bronze/Silver/Gold, Data Vault 2.0, Star Schema (Kimball)
- FinOps & Performance : -25% coûts Snowflake, optimisation datasets 100M+ lignes, Query Tuning
- Pipelines ELT/ETL : DBT (macros, tests, matérialisations), Airflow, Spark/PySpark
- Streaming & CDC : Snowpipe, Streams & Tasks, Kafka, ingestion near-real-time
- Data Warehouse : Snowflake, BigQuery, Databricks, PostgreSQL, Teradata
- Data Quality : Frameworks automatisés (Great Expectations), monitoring, alertes SLA
- Data Governance : RBAC, Dynamic Data Masking, Row Access Policies, RGPD
- DevOps & IaC : Terraform, Kubernetes (GKE), CI/CD (GitLab, Jenkins, Cloud Build)
- Data Virtualization : Starburst (Trino) pour architectures Zero Copy
- ML Ops : Mise en production de modèles Machine Learning
- Connexion BI : Intégration outils reporting et solutions BI
French
Native or bilingual
English
Fluent
Tamil
Native or bilingual
Experience
- EvorielLEAD DATA ENGINEERREAL ESTATEDecember 2024 - Today (1 year and 6 months)Paris, FranceContexteRefonte complète du patrimoine data d’un acteur majeur de l’immobilier, avec pour objectif de centraliser des flux hétérogènes au sein d’une Data Platform Snowflake Cloud, sécurisée, scalable et optimisée en coûts, à destination des usages BI.Migration progressive depuis des systèmes legacy (Business Objects, Oracle, SQL Server), avec de forts enjeux de qualité, performance et non-régression.ÉquipeCollaboration étroite avec les équipes Data, BI et métiers, dans un environnement hybride, orienté production.Mon rôleEn tant que Senior Data Engineer, j’interviens sur l’ensemble du cycle de vie de la plateforme :- Conception de l’architecture Snowflake multi-environnements (DEV / UAT / PROD)- Mise en place de la gouvernance data (RBAC, principe du moindre privilège)- Définition et implémentation d’une architecture Médaillon (Bronze / Silver / Gold)- Développement de pipelines ELT modernes avec dbt (macros, tests, incrémental)- Optimisation avancée des performances Snowflake (Cluster Keys, Query Profile, Search Optimization)- Pilotage des coûts et pratiques FinOps (Resource Monitors, auto-suspend, sizing des warehouses)- Implémentation des mécanismes de sécurité et conformité RGPD (Dynamic Masking, Row Access Policies)Outils / EnvironnementsSnowflake, SQL avancé, Python (Snowpark), dbt, Airflow / Snowflake Tasks, AWS S3.Résultats- Conception et mise en production d’une Data Platform Snowflake from scratch, prête pour des usages BI à l’échelle- Réduction moyenne de 25 % des coûts Snowflake grâce aux optimisations FinOps- Amélioration de 30 % des temps de réponse sur les requêtes critiques- Plateforme sécurisée, gouvernée et scalable, alignée avec les standards data modernes
- CNAV (Assurance Retraite)SENIOR DATA ENGINEERPUBLIC SECTORApril 2024 - December 2024 (8 months)Tours, FranceContexteModernisation du socle décisionnel gérant les données critiques de plus de 100 millions d’assurés, dans un cadre réglementaire strict impliquant des enjeux de souveraineté, performance et fiabilité.Objectif : améliorer les temps de traitement et la robustesse des pipelines data à très forte volumétrie.ÉquipeCollaboration avec les équipes Data Engineering et architecture, dans un environnement exigeant orienté production.Mon rôleEn tant que Senior Data Engineer, j’interviens sur des problématiques de volumétrie massive et d’optimisation des traitements :- Mise en place d’une architecture de data virtualization sécurisée via Starburst / Trino- Pilotage de la migration de données massives (CSV → Parquet)- Optimisation avancée de jobs PySpark sur Databricks (tuning mémoire, parallélisme, partitionnement)- Contribution à l’architecture cible et aux bonnes pratiques Data Engineering- Amélioration de la fiabilité et de la performance des traitements réglementaires critiquesOutils / EnvironnementsDatabricks, PySpark, Starburst (Trino), PostgreSQL, Python.Résultats- Migration de plus de 500 To de données vers des formats optimisés- Réduction de 45 % des temps de traitement nocturnes- Division par 2 du temps d’exécution des traitements réglementaires critiques- Pipelines data plus robustes et adaptés à des contraintes de production à grande échelle
- NCC GroupCLOUD DEVOPS ENGINEERSOFTWARE PUBLISHINGOctober 2023 - April 2024 (6 months)Manchester, UKContexteTransformation Cloud d’un éditeur logiciel international via la mise en place d’une Landing Zone GCP industrialisée pour accélérer les projets Data.Mon rôle- Conception d’architectures cibles Cloud (HLD / LLD)- Industrialisation complète via Terraform (IaC)- Mise en place de pipelines CI/CD (Cloud Build, dbt)- Sécurisation des environnements (IAM Least Privilege, KMS, conformité)- Optimisation coûts et résilience (HA / DR, SRE, autoscaling)Résultats- Environnements Cloud reproductibles, sécurisés et scalables- Réduction du time-to-market des projets data- Meilleure maîtrise des coûts Cloud via pratiques FinOps / GreenOps
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Data Engineer, Big data, IT, Artificial IntelligenceDataScientest.com2020Data Engineer, Big data, IT, Artificial Intelligence
- Master II MQSE, Maintenance, Qualité, Sécurité & EnvironnementUniversité Sorbonne Paris Nord2019Master II MQSE, Maintenance, Qualité, Sécurité & Environnement
Certifications
- Professionnal Data EngineerGoogle2024