You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Usama ShahUS

Usama Shah

Supermalter

Data Engineer / DataOps

€1,000/day
6 projects
Le Petit-Quevilly, FR
3-7 years

Average response time: 1 hour

About Usama

L'un des plus grands défis actuels est de savoir comment traiter correctement les données qui nous entourent.
Mon parcours professionnel m'a permis de combiner des connaissances en software engineering et des capacités d'analyse de données. Cela m'a également permis, au fil des ans, de contribuer au développement de divers pipelines IA pour de grandes entreprises dans les domaines de l'énergie et de la finance.

  • French

    Native or bilingual

  • English

    Fluent

Remote only
Primarily works remotely

Experience

  • Crédit Agricole SA
    Data Engineer / MLOps Engineer
    BANKING AND INSURANCE
    October 2021 - August 2022 (11 months)
    Montrouge, France
    Contexte:
    Mettre en oeuvre des solutions pour aider les data scientists à déployer des modèles ML distribués en production.

    Missions:
    - Développement de code élégant et simple pour des architectures et des applications performantes, fiables et maintenables.
    - Développement, packaging et déploiement de la solution interne d’AutoML distribuée avec Spark/H2O.aio
    - Conception et développement d’un template PySpark qui permet d’automatiser le packaging des dépendances et le déploiement des jobs Spark sur des plateformes HDP isolées avec (Shell/PEX (cluster pack)/Gitlab CI/CD)
    - Mise en place et maintenance des chaînes CI/CD (Gitlab CI)
    - Mise en place de tests continus, automatisés (unitaire, d'intégration, de non régression et de charge) et de coverage.
    - Migration des assets de production Spark 2.2 -> 2.4, HDP -> CDP
    - Débogage et optimisations des jobs Spark dans HDP
    - Développement dans un environnement agile
    Python PySpark Gitlab CI Docker Hadoop Pandas API UNIX
  • EDF SA
    Data Engineer / DataOps
    ENERGY AND UTILITIES
    September 2022 - September 2023 (1 year and 1 month)
    Puteaux, France
    Kubernetes OpenShift Docker SQL PostgreSQL Spark PySpark Git Gitlab CI/CD Airflow FastAPI Python Linux Hive Big Data Hadoop HDFS
  • BNP PARIBAS
    Data Scientist / Engineer
    BANKING AND INSURANCE
    September 2018 - September 2021 (3 years)
    Paris, France
    Contexte:
    Assurer une R&D activable en Data Science et IA :
    -Rechercher, tester et valider l'apport d'approches innovantes (NLP, Computer Vision, Speech Recognition, Boosting) sur des problématiques métiers Data Driven (détection de la fraude, recherche sémantique, scores d'appétence, efficacité opérationnelle, interprétation de modèles)
    -Contribuer le cas échéant à mettre en production des solutions adéquates répondant à ces problématiques grâce à la plateforme interne d'industrialisation en production de projets Python intégrant des principes BizOps et des capacités d'exposition étendues : Batch, Streaming, API, Webapp

    Missions
    - Développement de code élégant et simple pour des architectures et des applications performantes, fiables et maintenables.
    - Mise en place et maintenance de la chaîne CI/CD
    - Mise en place de test et de coverage sur l’ensemble de l’architecture logicielle
    - Mise en production et run de pipeline machine learning en Python
    - Monitoring des modèles en production avec des webapp (streamlit/dash)
    - Entraînement et déploiement en production d'un modèle de détection d'usurpation d'identité dans le cadre de la lutte contre la fraude:
    -> Extraction et transformation d'environ 700 Gb de données avec PySpark
    -> Inférence en moins de 500 ms avec un modèle type boosting
    -> Inférence en streaming (1 million d'events par jour)
    - Mise en production d'un modèle de détection de fraude chèque:
    -> Conversion d'un code SQL en Python pour pouvoir inférer en quasi temps réel (batch vers micro batch processing)
    - Optimisation : conception d'un solveur python (solution interne) permettant de résoudre un programme d'optimisation sous un grand nombre de contraintes non linéaires dans le cadre de sollicitations marketing
    - Extraction, manipulation, valorisation & visualisation d'un grand volume de données (> 700 gb)
    Python Spark Machine learning Jenkins SQL Cassandra Git Pandas Pytest Apache Kafka

Recommendations

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Skill set

Categories