You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Sacha ClementeSC

Sacha Clemente

Data Engineer / Python / SQL / Snowflake / DBT

€650/day
1 project
Toulouse, FR
8-15 years

Average response time: 1 hour

About Sacha

🚀
J'aide les entreprises à mettre en place des data plateformes sur des technologies modernes, pour régler les problèmes de scalabilité et de data qui impactent les produits de mes clients et permis à de nombreux clients de surmonter les défis de changement de plateforme, leur permettant ainsi de scaler leur business grâce à des solutions data simple et efficace

Expertise en Data Engineering :

Depuis 2018, j'accompagne des entreprises de toutes tailles – des start-ups aux grandes entreprises telles que Thales, Airbus, et Hygie31, Heuritech – dans le développement de data platformes robustes et scalables
Ces plateformes ont permis à mes clients de tirer pleinement parti de leurs données grâce à l'analytics et l'IA

Les bénéfices d'une data platform :

- Démocratiser l'accès aux données : Faciliter l'accès aux données pour tous les décideurs, stimulant ainsi la croissance grâce à l'analytics et à l'IA.
- Stimuler l'innovation : Permettre aux équipes d'explorer de nouvelles opportunités grâce à des insights plus pertinent.
- Réduire les coûts d'infrastructure : Optimiser les ressources existantes et réduire les dépenses liées à l'infrastructure
- Optimiser les coûts opérationnels


Pourquoi travailler avec moi ?

Engagement Client : Je ne travaille qu'avec un nombre limité de clients pour assurer un service de qualité supérieure.


En choisissant de travailler avec moi, vous bénéficiez d'un travail de qualité et approuvé, sans payer des tarifs exorbitants.


🛠️ Mes compétences clés :

Développement : Python, Pyspark, DBT, SQL, Git, Docker, Bash
Analyse de données : Analyses de données, méthodes statistiques
Streaming: Kafka, Redpandas
Datawarehouses & OLTP : Snowflake, Bigquery, Azure SQL ,PostgreSQL
Orchestration : Airflow, Prefect, Dagster
Visualisation des données : Tableau, Matplotlib
Modélisation : Schéma en étoile, Schéma en flocon, 3NF, Data Vault 2.0
Cloud : GCP, Snowflake,Azure, Azure DevOps, GitHub, Terraform, Docker, Databricks

  • English

    Fluent

  • French

    Native or bilingual

Can work on-site
Toulouse (up to 20km), Bordeaux (up to 20km), Paris (up to 20km), Lyon (up to 20km), Marseille (up to 20km)

Experience

  • Heuritech
    Malt logoOn Malt
    Architecture data & data engineering
    December 2023 - January 2024 (1 month)
    Paris, France
    Modernisation d’une data plateforme (mongoDB, ElasticSearch, GCP) on premise vers le
    cloud avec Snowflake, AWS, DBT

    Mission:
    - Ancienne Data Plateforme : Audit, Évaluation de l'infrastructure hybride existante (GCP- mongo on
    premises, Elasticsearch), identification des limitations et des pain points, collaboration avec
    les équipes métiers pour comprendre les besoins spécifiques et les use cases business

    - Propositions de nouvelles solutions pour moderniser l'architecture, Mise en place de
    kafka pour l'ingestion en streaming, Snowflake pour la data plateforme et DBT
    pour la transformation des données

    - Développement de la nouvelle data plateforme sur snowflake: mise en place des roles
    snowflakes, warehouses, modélisation des uses cases, création des bases de staging, dev
    ,prod, schema modélisation des tables, mise en place des clés de clustering

    - Ingestion des données Batch: Mise en place de snowpipe, connecter sur le google cloud
    storage permettant l’ingestion automatique des fichiers de l’entreprise
    - Ingestion des données streaming avec Kafka : Déploiement du Kafka prod sur une infra AWS
    l’ingestion des données en streaming, paramétrages des connecteur mongo & snowflake

    - Mise en place de DBT : Modélisation des pipelines et mise en place des transformations de
    données. Création des modèles incrementaux, vues, tables, snapshots

    - Orchestration des models via Dagster

    - Mise en place du CICD de la plateforme, avec des test automatiques

    - Automatisation des tâches : Création de scripts Python et bash pour automatiser diverses
    tâches de traitement des données

    Cloud computing Snowflake SQL DBT Data Engineer Python Architecture Big Data Automatisation Data Engineering Google Cloud Platform (GCP) Git prefectv2 redpandas Apache Kafka Kafka Connect CDC Change data capture Dagster Amazon Web Services
  • Hygie31
    Data engineer / Snowflake / DBT / Python / SQL / Azure
    CONSULTING AND AUDITS
    May 2023 - November 2023 (7 months)
    Toulouse, France
    Hygie31 Holding

    Data Engineer | Architecture | cloud

    mai 2023 - nov 2023


    Modernisation d'un système d'information on-premises (Microsoft SQL Server) vers une infrastructure de données moderne basée sur Snowflake, Azure, Python, Informatica (ETL/ELT) et DBT dans un contexte agile.

    Techno : Python, Azure, Snowflake, DBT, AzureDevops,SQL, Informatica

    Missions :

    Mise en place de l'infrastructure Azure : conception et déploiement d'environnements de développement sur Azure, avec leurs ressources associées, y compris Data Lake et Data Vault, Managed Identities, virtual machine, application SSOBeekeper

    Participations actives aux différentes avant ventes en français et en anglais

    Rôle base access control (RBAC) sur microsoft Entra ID, gestion des droits d'accès utilisateurs

    Infrastructure, RBAC snowflake : Création et administration des rôles, utilisateurs, entrepôts (warehouses), et autorisations sur Snowflake, en fonction des besoins spécifiques des utilisateurs

    Modélisation des données du datawarehouse snowflake en star schema et début de transformation en datavault2.0

    Développement de scripts python automatisant diverses tâches liées à la data
    dont:
    - Développement de pipeline en python
    - Webscrapping en python


    Conception d'un projet de web scraping visant à extraire des informations essentielles de bases de données de médicaments, tel que les prix, la notice, les identifiants CIP, etc

    Développement Informatica : Conception de pipelines de données, visant à migrer les données de l'environnement on-premises vers la plateforme Snowflake dans un stage “raw”

    Projet DBT développement du datawarehouse : transformation des données en 3 stages: staging, intermédiaire, mart pour les tables finales persistante
    Developpement de pipeline DBT et SQL

    Création des datamarts à destination des métiers (marketing, adhérents, compta, contrôle de gestion)

    Automatisation intégration continue du déploiement (CI/CD) à l'aide d'Azure DevOps pour les différents projets, notamment Informatica, Snowflake, et DBT
    DBT Snowflake Microsoft Azure Python SQL SQL Server Informatica Azure DevOps
  • Devoteam
    Lead data ops / Python / Airflow / SQL / PostgreSQL
    DIGITAL AND IT
    May 2022 - May 2023 (1 year)
    Toulouse, France
    devoteam - Airbus Aircraft

    Lead Data ops

    mai 2022 - mai 2023


    Création d’une plateforme MLOPS à destination des end user Airbus

    Techno: Python, Airflow, Docker, SQL, sparQL, neo4j, Github, PostgreSQL

    Missions :

    Définition des différentes tâches du projet :

    Définition du scope

    objectifs et livrables, planification des deadlines avec le client

    Définition des epics et découpage en tâches avec un kanban,

    Gestion d’équipe,

    Définition des rôles et responsabilité de chacun

    Design, conception et maintenance des pipelines afin de construire une plateforme de données pour le machine learning

    Machine learning traitement de similarité, théorie des graphs avec airflow et python pour ingérer des données préalablement traités dans des bases mongoDB
    -Pipeline python et pyspark

    Analyses de données, identifiant des tendances, vulgarisant les analyses, mise en place d'insights améliorant la compréhension des données d’airbus et aider la prise de décision

    Maintenance du datawarehouse PostgreSQL existant en optimisation les requêtes SQL, partionnement des tables volumineuses.

    Neo4j Modélisation des airbus business (théorie des graphes ) afin de découvrir les noeuds et les relations les plus influentes

    Collaboration avec les acteurs métier afin de nous fournir les informations sur les besoins et sur les processus de l'entreprise afin d'en déterminer les enjeux

    CICD gihub, automatisation actions github

    Python Airflow Docker SQL SPARQL Neo4j AWS MongoDB GitHub

Reviews

5,0

Out of 1 rating

T

Thomas

Heuritech

Reviewed on 03/01/2024

Très bonne expérience avec Sacha qui a su conseiller des solutions adaptés à nos besoins et nous accompagner dans notre transition technique

Recommendations

Karim MebroukKM
EM
Karim FisliKF
+1
Karim Mebrouk and 3 other people have recommended Sacha

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master en informatique, Informatique, statistique, mathématiques appliquées à la gestion de production
    Université Toulouse - Jean Jaurès
    2020
    Master en informatique, Informatique, statistique, mathématiques appliquées à la gestion de production
  • Licence Professionnelle, Gestion informatiques des données massives
    Université Paul Sabatier Toulouse III
    2018
    Licence Professionnelle, Gestion informatiques des données massives

Certifications

Skill set

Categories