Description

Cloud Engineer/Data Engineer à votre disposition pour vous aider dans vos projets à court, moyen ou même long terme.

D'un background back-end Java, grâce à plusieurs formations et spécialisations, je me suis reconverti dans ce qui me plaisait le plus dans l'informatique: la Data.

J'ai pu réaliser de nombreuses évolutions, corrections et créations (from scratch) d'applications ou d'infrastructure chez différents grands comptes (STMicroElectronics, Enedis) avant de mettre en place l'infrastructure Data chez Navya Group.

J'ai mis en place une plateforme Databricks sur plusieurs environnement from scratch ce qui m'a permis d'avoir de très bonnes connaissances de l'environnement Databricks et de Spark.

J'ai de bonnes connaissances également en BDDs (Oracle, MySQL, Redshift) ce qui me permet de faire de l'optimisation de performance sur ces outils.

J'ai également une forte appétence pour le DevOps (DataOps) via des outils tel que Terraform, Ansible, Grafana, etc...

Les services AWS que je connais très bien: Lambda, S3, Redshift, Datasync, Snowcone, KMS, IAM, VPC, Security Groups, EC2...

Finalement, on peut dire que j'apprécie travailler dans un environnement Cloud en alliant l'architecture, le développement et les bonnes pratiques !

Je suis très autonome et rigoureux dans mes délivrables. Je pousse pour avoir de la CI/CD le plus souvent possible pour robustifier les pipelines de mise en production.

PS: je suis entrain de me préparer à la certification AWS Solutions Architect - Associate.

Languages

French
Native or bilingual
English
Fluent

Workplace preferences

Can work on-site

Lyon (up to 15km)

NAVYA Group
Data Engineer & Data Ops
January 2021 - December 2022 (1 year and 11 months)
Lyon, France
Contexte: une petite équipe (avec des prestataires de temps en temps) dans un domaine fonctionnel autour de la navette autonome. Rôle de lead tech data avec pour objectif de mettre en place une architecture data scalable. Tâches effectuées en Data Engineer:
- Migration de l'ancien ETL Python sur Databricks en Spark
- Utilisation de différents connecteurs (MySQL,Redshift...)
- Migration de 2 anciens pipelines
- Ajout de nouvelles sources de données (Git, Prometheus, custom Navya...)
- Monitoring des jobs avec Databricks SQL
- Création et complétion d'un document global pour le lineage de la donnée
- Gestion d'un Redshift avec les bonnes pratiques (schémas et users spécifiques, convention de nommage). Benchmark des différents algos d'encodage sur les colonnes de AWS.
- Gestion d'un outil d'analyse (Tableau) avec l'ajout de nouvelles sources de données (dont Databricks et Redshift)
- Etude et mise en place d'un pipeline complexe pour remonter et traiter des gros volumes de données (me contacter pour plus d'informations) Tâches effectuées en Data Architect/Data Ops:
- Benchmark et comparaison de différentes plateformes Data (SaaS ou à construire)
- Mise en place de la plateforme Databricks via Terraform sur plusieurs environnements
- Mise en place des bonnes pratiques pour l'intégration de Databricks sur AWS:
- Réseau (VPC, Subnets, Security Groups etc...)
- Sécurité (KMS, S3 chiffré, rôles IAM et instance profiles etc...)
- Stockage (multi-couches sur S3 avec des cycles de vie différents etc...)
- Calcul (EC2, Pool, Tags, scripts d'init ...)
- Coût (polices spécifiques pour chaque équipe ...)
- Monitoring (jobs, S3, coûts ...)
- Utilisateurs
- Configuration d'un Nexus
- Gestion d'un Gitlab (runners, users, groupes, projects)
- Création de projets pyspark boilerplate pour faciliter le travail des équipes et donner les bonnes pratiques
- Mise en place de CI & CD sur Databricks avec dbx sur différents environnements Gitlab
Enedis
Consultant Senior Java / Python
April 2019 - September 2020 (1 year and 5 months)
1 Espl. François Mitterrand, 69002 Lyon, France
Contexte: galaxie d'applications d'aide au déploiement des compteurs Linky
- Corrections d'anomalies et de bugs (JAVA1.8 et Informatica)
- Créations d'utilitaires python pour des besoins ponctuels (rattrapage de données, comparaison de données ou encore automatisation)
- Optimisation de requêtes SQL (Oracle 11.2)
- Analyses approfondies et propositions d'améliorations de batchs (SpringBatch et Informatica)
- Création de tests automatisés de bout en bout pour Informatica. Tests intégrés directement dans le projet maven principal
- Création d'un outil de gestion de métriques fonctionnelles pour faciliter le monitoring de la production (Python 3.6 pour le développement, Ansible pour le déploiement). Utilisation d'appels REST (librairie request), d'appels SSH (librairie paramiko) ou de requêtes SQL (librairie cx_Oracle). La déclaration et la publication des métriques se fait via une solution Kafka branchée sur un Grafana pour faire les indicateurs graphiques.
- Présentation et formation aux futurs utilisateurs de l'outil de gestion de métriques
Stmicroelectronics
Ingénieur Informatique Systèmes d'info Solutions
November 2015 - November 2018 (3 years)
Informatique industrielle où j'ai pu réaliser des projets seuls ou en équipe :
- Une application RT en JAVA 1.8, JEE 8 (Wildfly 12), Primefaces et Oracle SQL pour de la gestion de consommables sur des équipements (optimisation et affichage). Cache partagé et forte robustesse pour une application 24h/7j
- Etude de faisabilité beacons et Windows 10
- Création d'un utilitaire de concaténation de fichiers avec une logique métier
- Développements Java 1.6 sur de la transformation de données en entrée et sortie d'un moteur d'optimisation
- Récupération de besoins utilisateurs et réalisations de reportings financiers/ industriels
- Création/modification de rapports via un outil propriétaire
- Migration d'une base 6i à 10g (Oracle SQL)
- Développements VB6 sur du suivi de FAB

Check out Arthur's experience

Sébastien

Head of Darwin delivery - Engie Digital - Plateforme Darwin

Less than 1 year project

Reviewed on 23/02/2026

Arthur est intervenu en tant que lead databricks dans notre équipe. Il a encadré techniquement une dizaine de data engineers databricks répartis dans plusieurs feature teams. Excellente expertise Databricks, AWS, Azure. Excellente communication avec tous les membres du projet. Très bon niveau d'Anglais. Je recommande Arthur.

Christophe Buffel Du Vaure and 1 other person have recommended Arthur

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Diplôme d'ingénieur, Informatique
Polytech Grenoble
2015
Diplôme d'ingénieur, Informatique
Baccalauréat S - Science de l'ingénieur, Science de l''ingénierie
Lycée Rosa Parks
2010
Baccalauréat S - Science de l'ingénieur, Science de l''ingénierie

Functional Programming in Scala
Coursera
2020
https://www.coursera.org/account/accomplishments/specialization/certificate/K9YEQS8GK325
Scala Functional Programming Spark
Spécialisation Deep Learning
Coursera
2019
https://www.coursera.org/account/accomplishments/specialization/M2LEYFXY3BQ2
Deep Learning Python

Data Engineer

Arthur Clerc-Gherardi

Lead Data Engineer / Databricks Champion

About Arthur

Experience

Reviews

5,0

Quality

5,0

Deadline

5,0

Communication

5,0

Sébastien

Recommendations

These freelancer profiles also match your criteria

Education

Certifications

Skill set

Categories