You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Donald BatokaDB

Donald Batoka

Data Engineer

€555/day
Paris, FR
3-7 years

Average response time: 1 hour

About Donald

Bonjour,

Je suis issue d'une formation d'intelligence artificiel et de big data avec un Mastère Spécialisé de Telecom Paris. J'ai donc une très bonne connaissance des outils Big Data et la programmation Python. J'interviens donc en tant que Data Engineer et Data Ops.

Je suis donc disponible pour une prestation en tant que Data Engineer pour le traitement traitement des données à grande échelle (dans le cloud ou sur un infrastructure on-premise). Mes compétence en programmation vont de la programmation séquentiel à la programmation orientée objet. J'ai une bonne maitrise des principaux outils et librairies de traitement Big Data : Spark (PySpark), Pandas, Numpy, Scikit-Learn, Matplotlib, Seaborn et bien d'autres encore.

Je suis habitué à travailler dans des environnement agile, utilisant des outils de gestion et de versioning de code comme Git (Azure DevOps, Gitlab, Github).

J'ai également des compétences en traitement de données sur des clouds providers tels que Azure/AWS (Databricks, ADLS Gen2).

Je reste disponible pour un échange.

CV sur demande.

Merci d'avance pour nos futurs collaborations
  • English

    Native or bilingual

Can work on-site
Paris (up to 50km)

Experience

  • Open Value
    Data Engineer
    July 2024 - Today (1 year and 11 months)
    Neuilly-sur-Seine, France
    Recruter pour une mission en tant que Data Engineer mon travail consiste à :
    - Créer une librairie d'ingestion des données depuis diverses source (Oracle, Minio, Postgres, fichiers Excel, CSV)
    - Traiter et stocker les données suivant une architecture medallion
    - Preparer les données pour les utilisateurs finaux sur Postgres
    - Réaliser de diverses transformation sur les dataframes : jointure, changement de type, aggregation, filtres, vérification des règles de qualité et diverses opérations
    Spark Minio Oracle Jupyter notebooks PySpark
  • AXA France
    Data Engineer, Data Ops
    BANKING AND INSURANCE
    November 2023 - May 2024 (6 months)
    Nanterre, France
    - Traitement des données en PySpark sur Azure Databricks
    - Traitement des données avec la solution Databricks SQL
    - Industrialisation de l'offre Databricks SQL au sein de la plateforme Big Data
    - Modification des pipelines CI/CD
    - Programmation PowerShell
    Databricks Azure Databricks Azure Data Engineer Git Azure DevOps PySpark Python
  • Veolia
    Data Scientist
    ENERGY AND UTILITIES
    November 2022 - Today (3 years and 7 months)
    Paris, France
    - Nettoyage, Préparation et Visualisation des données
    - Analyse des séries temporelles (Time Series)
    - Algorithmes de détection de changement de tendance
    Python Pandas Numpy Matplotlib Plotly

Recommendations

Be the first to recommend Donald

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Mastère Big Data et Intelligence Artificielle
    Telecom Paris
    2023
    - Modélisation statistique : Régression linéaire, tests statistiques - Machine/Deep Learning (Théorie et pratique) : Régression, classification, clustering - Manipulation des données volumineuses - Utilisation des principales solutions de stockages des fichiers et données

Skill set

Categories