You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Arthur Clerc-GherardiAC

Arthur Clerc-Gherardi

Supermalter

Lead Data Engineer / Databricks Champion

On-demand
1 project
Lyon, FR
8-15 years

Average response time: 1 hour

About Arthur

Cloud Engineer/Data Engineer à votre disposition pour vous aider dans vos projets à court, moyen ou même long terme.
D'un background back-end Java, grâce à plusieurs formations et spécialisations, je me suis reconverti dans ce qui me plaisait le plus dans l'informatique: la Data.
J'ai pu réaliser de nombreuses évolutions, corrections et créations (from scratch) d'applications ou d'infrastructure chez différents grands comptes (STMicroElectronics, Enedis) avant de mettre en place l'infrastructure Data chez Navya Group.
J'ai mis en place une plateforme Databricks sur plusieurs environnement from scratch ce qui m'a permis d'avoir de très bonnes connaissances de l'environnement Databricks et de Spark.
J'ai de bonnes connaissances également en BDDs (Oracle, MySQL, Redshift) ce qui me permet de faire de l'optimisation de performance sur ces outils.

J'ai également une forte appétence pour le DevOps (DataOps) via des outils tel que Terraform, Ansible, Grafana, etc...
Les services AWS que je connais très bien: Lambda, S3, Redshift, Datasync, Snowcone, KMS, IAM, VPC, Security Groups, EC2...

Finalement, on peut dire que j'apprécie travailler dans un environnement Cloud en alliant l'architecture, le développement et les bonnes pratiques !
Je suis très autonome et rigoureux dans mes délivrables. Je pousse pour avoir de la CI/CD le plus souvent possible pour robustifier les pipelines de mise en production.

PS: je suis entrain de me préparer à la certification AWS Solutions Architect - Associate.



  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Lyon (up to 15km)

Experience

  • NAVYA Group
    Data Engineer & Data Ops
    January 2021 - December 2022 (1 year and 11 months)
    Lyon, France
    Contexte: une petite équipe (avec des prestataires de temps en temps) dans un domaine fonctionnel autour de la navette autonome. Rôle de lead tech data avec pour objectif de mettre en place une architecture data scalable. Tâches effectuées en Data Engineer:
    - Migration de l'ancien ETL Python sur Databricks en Spark
    - Utilisation de différents connecteurs (MySQL,Redshift...)
    - Migration de 2 anciens pipelines
    - Ajout de nouvelles sources de données (Git, Prometheus, custom Navya...)
    - Monitoring des jobs avec Databricks SQL
    - Création et complétion d'un document global pour le lineage de la donnée
    - Gestion d'un Redshift avec les bonnes pratiques (schémas et users spécifiques, convention de nommage). Benchmark des différents algos d'encodage sur les colonnes de AWS.
    - Gestion d'un outil d'analyse (Tableau) avec l'ajout de nouvelles sources de données (dont Databricks et Redshift)
    - Etude et mise en place d'un pipeline complexe pour remonter et traiter des gros volumes de données (me contacter pour plus d'informations) Tâches effectuées en Data Architect/Data Ops:
    - Benchmark et comparaison de différentes plateformes Data (SaaS ou à construire)
    - Mise en place de la plateforme Databricks via Terraform sur plusieurs environnements
    - Mise en place des bonnes pratiques pour l'intégration de Databricks sur AWS:
    - Réseau (VPC, Subnets, Security Groups etc...)
    - Sécurité (KMS, S3 chiffré, rôles IAM et instance profiles etc...)
    - Stockage (multi-couches sur S3 avec des cycles de vie différents etc...)
    - Calcul (EC2, Pool, Tags, scripts d'init ...)
    - Coût (polices spécifiques pour chaque équipe ...)
    - Monitoring (jobs, S3, coûts ...)
    - Utilisateurs
    - Configuration d'un Nexus
    - Gestion d'un Gitlab (runners, users, groupes, projects)
    - Création de projets pyspark boilerplate pour faciliter le travail des équipes et donner les bonnes pratiques
    - Mise en place de CI & CD sur Databricks avec dbx sur différents environnements Gitlab
  • Enedis
    Consultant Senior Java / Python
    April 2019 - September 2020 (1 year and 5 months)
    1 Espl. François Mitterrand, 69002 Lyon, France
    Contexte: galaxie d'applications d'aide au déploiement des compteurs Linky
    - Corrections d'anomalies et de bugs (JAVA1.8 et Informatica)
    - Créations d'utilitaires python pour des besoins ponctuels (rattrapage de données, comparaison de données ou encore automatisation)
    - Optimisation de requêtes SQL (Oracle 11.2)
    - Analyses approfondies et propositions d'améliorations de batchs (SpringBatch et Informatica)
    - Création de tests automatisés de bout en bout pour Informatica. Tests intégrés directement dans le projet maven principal
    - Création d'un outil de gestion de métriques fonctionnelles pour faciliter le monitoring de la production (Python 3.6 pour le développement, Ansible pour le déploiement). Utilisation d'appels REST (librairie request), d'appels SSH (librairie paramiko) ou de requêtes SQL (librairie cx_Oracle). La déclaration et la publication des métriques se fait via une solution Kafka branchée sur un Grafana pour faire les indicateurs graphiques.
    - Présentation et formation aux futurs utilisateurs de l'outil de gestion de métriques
  • Stmicroelectronics
    Ingénieur Informatique Systèmes d'info Solutions
    November 2015 - November 2018 (3 years)
    Informatique industrielle où j'ai pu réaliser des projets seuls ou en équipe :
    - Une application RT en JAVA 1.8, JEE 8 (Wildfly 12), Primefaces et Oracle SQL pour de la gestion de consommables sur des équipements (optimisation et affichage). Cache partagé et forte robustesse pour une application 24h/7j
    - Etude de faisabilité beacons et Windows 10
    - Création d'un utilitaire de concaténation de fichiers avec une logique métier
    - Développements Java 1.6 sur de la transformation de données en entrée et sortie d'un moteur d'optimisation
    - Récupération de besoins utilisateurs et réalisations de reportings financiers/ industriels
    - Création/modification de rapports via un outil propriétaire
    - Migration d'une base 6i à 10g (Oracle SQL)
    - Développements VB6 sur du suivi de FAB

Reviews

5,0

Out of 1 rating

S

Sébastien

Head of Darwin delivery - Engie Digital - Plateforme Darwin

Less than 1 year project

-

Reviewed on 23/02/2026

Arthur est intervenu en tant que lead databricks dans notre équipe. Il a encadré techniquement une dizaine de data engineers databricks répartis dans plusieurs feature teams. Excellente expertise Databricks, AWS, Azure. Excellente communication avec tous les membres du projet. Très bon niveau d'Anglais. Je recommande Arthur.

Recommendations

Christophe Buffel Du VaureCB
YR
Christophe Buffel Du Vaure and 1 other person have recommended Arthur

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Diplôme d'ingénieur, Informatique
    Polytech Grenoble
    2015
    Diplôme d'ingénieur, Informatique
  • Baccalauréat S - Science de l'ingénieur, Science de l''ingénierie
    Lycée Rosa Parks
    2010
    Baccalauréat S - Science de l'ingénieur, Science de l''ingénierie

Certifications

Skill set

Categories