About Sacha
English
Fluent
French
Native or bilingual
Experience
- Heuritech
On Malt
Architecture data & data engineeringDecember 2023 - January 2024 (1 month)Paris, FranceModernisation d’une data plateforme (mongoDB, ElasticSearch, GCP) on premise vers lecloud avec Snowflake, AWS, DBTMission:- Ancienne Data Plateforme : Audit, Évaluation de l'infrastructure hybride existante (GCP- mongo onpremises, Elasticsearch), identification des limitations et des pain points, collaboration avecles équipes métiers pour comprendre les besoins spécifiques et les use cases business- Propositions de nouvelles solutions pour moderniser l'architecture, Mise en place dekafka pour l'ingestion en streaming, Snowflake pour la data plateforme et DBTpour la transformation des données- Développement de la nouvelle data plateforme sur snowflake: mise en place des rolessnowflakes, warehouses, modélisation des uses cases, création des bases de staging, dev,prod, schema modélisation des tables, mise en place des clés de clustering- Ingestion des données Batch: Mise en place de snowpipe, connecter sur le google cloudstorage permettant l’ingestion automatique des fichiers de l’entreprise- Ingestion des données streaming avec Kafka : Déploiement du Kafka prod sur une infra AWSl’ingestion des données en streaming, paramétrages des connecteur mongo & snowflake- Mise en place de DBT : Modélisation des pipelines et mise en place des transformations dedonnées. Création des modèles incrementaux, vues, tables, snapshots- Orchestration des models via Dagster- Mise en place du CICD de la plateforme, avec des test automatiques- Automatisation des tâches : Création de scripts Python et bash pour automatiser diversestâches de traitement des données - Hygie31Data engineer / Snowflake / DBT / Python / SQL / AzureCONSULTING AND AUDITSMay 2023 - November 2023 (7 months)Toulouse, FranceHygie31 HoldingData Engineer | Architecture | cloudmai 2023 - nov 2023Modernisation d'un système d'information on-premises (Microsoft SQL Server) vers une infrastructure de données moderne basée sur Snowflake, Azure, Python, Informatica (ETL/ELT) et DBT dans un contexte agile.Techno : Python, Azure, Snowflake, DBT, AzureDevops,SQL, InformaticaMissions :Mise en place de l'infrastructure Azure : conception et déploiement d'environnements de développement sur Azure, avec leurs ressources associées, y compris Data Lake et Data Vault, Managed Identities, virtual machine, application SSOBeekeperParticipations actives aux différentes avant ventes en français et en anglaisRôle base access control (RBAC) sur microsoft Entra ID, gestion des droits d'accès utilisateursInfrastructure, RBAC snowflake : Création et administration des rôles, utilisateurs, entrepôts (warehouses), et autorisations sur Snowflake, en fonction des besoins spécifiques des utilisateursModélisation des données du datawarehouse snowflake en star schema et début de transformation en datavault2.0Développement de scripts python automatisant diverses tâches liées à la datadont:- Développement de pipeline en python- Webscrapping en pythonConception d'un projet de web scraping visant à extraire des informations essentielles de bases de données de médicaments, tel que les prix, la notice, les identifiants CIP, etcDéveloppement Informatica : Conception de pipelines de données, visant à migrer les données de l'environnement on-premises vers la plateforme Snowflake dans un stage “raw”Projet DBT développement du datawarehouse : transformation des données en 3 stages: staging, intermédiaire, mart pour les tables finales persistanteDeveloppement de pipeline DBT et SQLCréation des datamarts à destination des métiers (marketing, adhérents, compta, contrôle de gestion)Automatisation intégration continue du déploiement (CI/CD) à l'aide d'Azure DevOps pour les différents projets, notamment Informatica, Snowflake, et DBT
- DevoteamLead data ops / Python / Airflow / SQL / PostgreSQLDIGITAL AND ITMay 2022 - May 2023 (1 year)Toulouse, Francedevoteam - Airbus AircraftLead Data opsmai 2022 - mai 2023Création d’une plateforme MLOPS à destination des end user AirbusTechno: Python, Airflow, Docker, SQL, sparQL, neo4j, Github, PostgreSQLMissions :Définition des différentes tâches du projet :Définition du scopeobjectifs et livrables, planification des deadlines avec le clientDéfinition des epics et découpage en tâches avec un kanban,Gestion d’équipe,Définition des rôles et responsabilité de chacunDesign, conception et maintenance des pipelines afin de construire une plateforme de données pour le machine learningMachine learning traitement de similarité, théorie des graphs avec airflow et python pour ingérer des données préalablement traités dans des bases mongoDB-Pipeline python et pysparkAnalyses de données, identifiant des tendances, vulgarisant les analyses, mise en place d'insights améliorant la compréhension des données d’airbus et aider la prise de décisionMaintenance du datawarehouse PostgreSQL existant en optimisation les requêtes SQL, partionnement des tables volumineuses.Neo4j Modélisation des airbus business (théorie des graphes ) afin de découvrir les noeuds et les relations les plus influentesCollaboration avec les acteurs métier afin de nous fournir les informations sur les besoins et sur les processus de l'entreprise afin d'en déterminer les enjeuxCICD gihub, automatisation actions github
Reviews
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master en informatique, Informatique, statistique, mathématiques appliquées à la gestion de productionUniversité Toulouse - Jean Jaurès2020Master en informatique, Informatique, statistique, mathématiques appliquées à la gestion de production
- Licence Professionnelle, Gestion informatiques des données massivesUniversité Paul Sabatier Toulouse III2018Licence Professionnelle, Gestion informatiques des données massives
Certifications
- Azure Data FundamentalsMicrosoft2022