You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Houcine Ben GuedriaHB

Houcine Ben Guedria

Data Engineer | PySpark · Databricks · AWS

€480/day
Tunis, TN
3-7 years

Average response time: 1 hour

About Houcine

Data Engineer avec 4+ ans d'expérience sur des projets internationaux. Je conçois des pipelines de données robustes, des architectures cloud AWS/Azure et des solutions de traitement à grande échelle avec PySpark et Databricks. Disponible en remote, facturation B2B.
  • French

    Native or bilingual

  • English

    Native or bilingual

Remote only
Primarily works remotely

Experience

  • Fathom Data
    Data Engineer / Data Scientist
    August 2023 - May 2026 (2 years and 9 months)
    ▸ Conception et maintenance de pipelines ETL/ELT robustes sur AWS, assurant une livraison fiable des données
    pour les workflows analytiques et ML sur plusieurs projets clients.
    ▸ Développement d'un pipeline d'analyse de parcours à grande échelle avec PySpark sur Databricks, traitant
    plus de 3M de lignes pour calculer les coûts uniques par étape produit et fournir des insights opérationnels.
    ▸ Développement de services data backend (Python, FastAPI, Flask, PostgreSQL) avec Marshmallow pour la
    validation de schémas et Alembic pour les migrations de base de données, permettant un accès aux données
    en temps réel.
    ▸ Conception de templates d'infrastructure Terraform réutilisables pour un déploiement cohérent et
    reproductible entre projets clients, réduisant significativement les délais de mise en place.
    ▸ Mise en place de pipelines CI/CD (GitHub Actions, Docker) pour améliorer la vitesse de déploiement et
    réduire les erreurs manuelles.
    ▸ Automatisation de la configuration système sur machines Linux clients via Ansible, incluant la gestion des logs
    et la supervision.
    ▸ Livraison d'un pipeline de vision par ordinateur conteneurisé (YOLO, 1 800 images labelisées, Azure) avant
    transition vers l'ingénierie des données.
    Databricks Python PySpark Gitlab CI/CD Docker
  • Govwise
    Data Scientist
    March 2022 - March 2023 (1 year)
    ▸ Développement d'algorithmes de matching en Python pour aligner les utilisateurs avec des contenus
    pertinents, améliorant l'engagement et la rétention.
    ▸ Construction de pipelines de web scraping automatisés (Selenium, Playwright) pour collecter et structurer de
    larges jeux de données pour l'analyse.
    Pandas Python Playwright Web Scraping PostgreSQL

Recommendations

Be the first to recommend Houcine

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Certifications

Skill set

Categories