You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Sara HemmiSH

Sara Hemmi

Administrateur Architecte Big Data

€620/day
Paris, FR
8-15 years

Average response time: 1 hour

About Sara

Passionnée par la data, dotée d’un mastère spécialisé en Big Data, j’accompagne les entreprises dans la transformation de leur système d’information.

Autonome et forte de proposition, j’aide à appréhender toute la chaîne d’un projet data, depuis l’intégration des données jusqu’à l’industrialisation des modèles.

Poussé par mon sens du service toujours orienté utilisateur, j’interviens sur des projets Big Data impliquant différentes problématiques : déploiement, configuration, architecture, industrialisation …

Après quelques année passées à la mise en place et à l’administration d’infrastructure technique des données, j’ai décidé de réorienter ma carrière vers le métier d'architecte : concevoir des architectures de données en tenant compte des besoins métiers d'une entreprise.

Pour suivre et répondre aux nouveaux cas d’usage , je suis en plein montée en compétances sur les technologies de Cloud computing dont j’ai enraichi mes connaissances avec les certifications AZ 900 et AZ 104.
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • BPCE-IT
    Architecte/administrateur big data
    BANKING AND INSURANCE
    June 2024 - Today (2 years)
    Charenton-le-Pont, France
    Support niveau 3 et administration des clusters Cloudera en production, hotline et astreintes.

    Accompagnement et onboarding de nouveaux projets sur la plateforme Big Data, résolution rapide des tickets.

    Déploiement et intégration de Starburst sur Openshift, intégration de Ranger pour gestion des permissions, optimisation des catalogues dynamiques et WarpZSpeed Caching.

    Définition de l’architecture cible et conception de modèles de données optimisés pour performance et gouvernance.

    Supervision des pipelines et plateformes, garantissant sécurité, conformité et qualité des données.

    Accompagnement des équipes techniques et métiers dans la mise en œuvre des solutions.
    Cloudera Cloudera Data Platform starburst Hadoop On premise
  • Bouygues Telecom
    Consultante big data
    April 2023 - Today (3 years and 2 months)
    Meudon, France
    Maintien et veille technique d'une plateforme Big Data utilisé par une équipe de data scientists. Assurer la conception et la maintenance des flux de données, le traitement, le stockage et la préparation des données en collaborant étroitement avec les data scientists et en automatisant les workflows pour améliorer l'efficacité opérationnelle.
    • Maintien et support d'une plateforme Big Data composé de Spark, MinIO, Jupyter et Airflow déployé sur Openshift.
    • Conception, développement et maintenance des pipelines de données : pour permettre l'acquisition, le traitement, le stockage et la mise à disposition efficaces des données provenant de différentes sources internes et externes.
    • Intégration des données : assurer une centralisation des données cohérente en provenance de multiples sources, affin de permettre une vision unifiée des informations et faciliter les analyses transversales pour les équipes métier.
    • Qualité et fiabilité des données : mise en place des contrôles de validation rigoureux et des mécanismes de nettoyage des données pour garantir la qualité, la cohérence et la fiabilité des données utilisées dans les rapports et les analyses.
    • Surveillance et maintenance des pipelines en continu pour détecter et résoudre rapidement les incidents, minimisant ainsi les temps d'arrêt et assurant la disponibilité constante des données.
    • Sécurité des données pour garantir la fiabilité des données sensibles conformément aux politiques de confidentialité et de conformité de l'entreprise.
    • Automatisation des processus pour les tâches répétitives, afin d'augmenter l'efficacité opérationnelle.
    • Mettre à disposition une documentation complète des pipelines de données, des schémas et des flux de travail, pour faciliter la collaboration et la communication au sein de l'équipe. ENVIRONNEMENT : Openshift, MinIO, Spark, PySpark, Jupyter, Airflow
  • BANQUE DE FRANCE
    Administrateur/Architecte Big Data
    September 2018 - October 2022 (4 years and 1 month)
    Île-de-France, France
    Support niveau 3. Administration des clusters Hadoop et Elasticsearch Maintien des clusters Hadoop et Elasticsearch Mise en place d'un système de supervision centralisé pour les clusters Hadoop et Elasticsearch. Étude, proposition, mise en place et accompagnement des projets dans leur choix technologique : comprendre les enjeux métiers et les besoins en matière de données (utilisation et gestion) pour les intégrer aux infrastructures techniques existantes Chantier de migration et de sauvegarde HBase : proposition d'une nouvelle architecture plus performante qui répond le mieux aux besoins projet. Migration HDP 2.6 vers CDP Base 7.x
    - Étude de la nouvelle plateforme : Benshmark des différents form factor(CDP Public et Private Cloud). Participation dans la mise en place du dossier d'architecture et de spécifications détaillées pour le déploiement de CDP 7.x (définition et répartition des composants par type de nœud, normalisation des configurations spécifiques : HA …)
    - Participation dans la mise en place de la nouvelle plateforme( prérequis, installation et configuration post-install)
    - Qualification technique des nouveaux composants (cloudera Manager…)
    - Qualification technique des composant mise à jour (déprécation, nouveautés : Hive2 vs Hive3 …)
    - Étude d'impact fonctionnelle et accompagnement des projets pour la migration de leur code applicatif. Data gouvernance
    - Participation aux études mené pour le choix de la solution à mettre en place (Microsoft azure PurView, amazon EMR, Cloudera datacatalog …)
    - Qualification et mise en place d'Apache ATLAS.
    - Conception d'un modèle de « security by design » pour accéder au patrimoine de données de la banque :
    - Définir le type et le rôle des profils Data catalogue.
    - Sécuriser les accès pour le data Catalogue pour :
    - Les accès à l'IHM ATLAS.
    - Les accès aux données.
    - Renforcer la sécurité pour l'accès aux IHM ci-dessus et en particulier pour les rôles à privilège en double authentification.

Recommendations

Be the first to recommend Sara

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • master big data & cloud computing, big data
    Université Hassan II Aïn Chock de Casablanca
    2017
    master big data & cloud computing, big data
  • Licence sciences mathématique et informatique, Informatique
    Université Hassan II Aïn Chock de Casablanca
    2015
    Licence sciences mathématique et informatique, Informatique

Skill set (7)

Categories