Kokoè A.

Data scientist Python/ R / Hadoop

Moves to Paris

  • 48.8546
  • 2.34771
  • Indicative rate €600 / day
  • Experience 2-7 years
  • Response rate 100%
  • Response time 1h
Propose a project The project will only begin when you accept Kokoè's quote.

Confirmed availability

Propose a project The project will only begin when you accept Kokoè's quote.

Location and geographical scope

Location
Paris, France
Can work in your office at
  • Paris and 50km around

Preferences

Project length
≥ 6 months
Business sector
  • Energy & Utilities
  • Telecommunications
  • Banking & Insurance
  • Logistics & Supply Chain
  • Retail
+5 autres

Verifications

Languages

  • Anglais

    Full professional proficiency

  • Français

    Native or bilingual

Skills (9)

  • BigData
  • Beginner Intermediate Advanced
  • Beginner Intermediate Advanced
  • Databases
  • Beginner Intermediate Advanced
  • Languages
  • Beginner Intermediate Advanced
  • SQL
    Beginner Intermediate Advanced
  • All
  • R
    Beginner Intermediate Advanced
  • Beginner Intermediate Advanced
  • Beginner Intermediate Advanced

Kokoè in a few words

Je suis Data scientist depuis 5 ans spécialisée sur la mise en oeuvre de modèles prédictifs de Machine Learning. Je développe en langages de programmation Python, R et SQL.
J'ai aussi une bonne connaissance de l'écosystème Big Data Hadoop avec les outils Spark et Hive.
Je réalise les projets Data Science de bout en bout, depuis la formalisation de la problématique métier en problème data, en passant par l'acquisition des données, la modélisation jusqu'au reporting des résultats.

Mes missions:
- Collecter et analyser des données pertinentes
- Élaborer des algorithmes prédictifs afin d'anticiper l'évolution des données et tendances
- Élaborer des algorithmes de segmentations pour aider à la prise de décision

Experience

COVAGE

Telecommunications

Data Analyst

Sèvres, France

October 2019 - June 2020

Entité : Direction des Systèmes d’Information, équipe Projet

Projet : « Data Excellence Program » : Maintenance applicative corrective des flux d’échange sur le déploiement des infrastructures de la Fibre pour redresser la qualité des données en coordination avec les métiers.

Activités
• Appliquer les contrôles de mesures de qualités de données sur les flux d’échanges
• Identifier les incohérences et erreurs puis les transférer aux correspondants métier
• Réaliser les rapports hebdomadaires de mesure de qualité de données et de suivi de correction
• Définir et piloter les plans de correction en liaison avec les correspondants métier
• Faire les corrections en masse dans le système d’information

Résultats : Le ratio de prises déployées conformes en termes de contenu et de format s’est amélioré, passant de 65% à 82%.

ORANGE - ORANGE

Telecommunications

Data Scientist

Arcueil, France

July 2019 - September 2019

Entité : Direction de l’Intervention, pôle Data Mining

Contexte : Réaliser les études de Data Mining et construire des algorithmes de Machine Learning pour résoudre les problématiques de performance et d’efficacité opérationnelle du domaine de l’intervention.

Projet 1 : « Prédiction des échecs de mise en service des nouvelles lignes de clients » : développer un outil de détection des risques d’échec de mise en service et identifier les causes racines pour réduire les coûts opérationnels de maintenance SAV.

Activités :
• Formaliser la problématique métier et définir la démarche méthodologique pour la résoudre
• Préparer la base d’analyse : analyses descriptives, traitements des données, échantillonnage
• Élaborer les modèles prédictifs : Lasso, Forêts aléatoire, XGBoost
• Optimiser et simuler les performances des modèles
• Réaliser les analyses explicatives : classification des observations les plus risquées et analyses descriptives des variables les plus contributrices au risque d’échec
• Automatiser la chaîne de traitement de préparation des données et de modélisation pour aider la mise en production de l’outil de détection

Résultats : Le modèle final permet de détecter 17% du total des échecs de mises en service, soit un gain de 17 000 interventions de maintenance évitées par an.

ORANGE - ORANGE

Telecommunications

Data Scientist

Arcueil, France

April 2018 - June 2019

Projet 2 : « Performance des opérations de mise en service de nouvelles lignes » : Développer un outil de mesure de l’efficacité opérationnelle des mises en service des nouvelles de clients, à destination de l’ensemble des 24 unités opérationnelles en région.

Activités :
• Définir le dictionnaire de données et les règles de gestion pour croiser les données issues de source de données différentes et de domaines métier transverses
• Développer les flux de données : interventions de mise en service, tests électriques, entreprise sous-traitante, signalisation client, intervention de maintenance etc…
• Intégrer des données dans l’outil Qlik Sense et programmer leur mise à jour quotidienne
• Construire les tableaux de visualisation pour décomposer le taux de ré-intervention (SAV) suivant différents axes d’analyses (département, diagnostics de tests, ancienneté de la ligne etc…)

Résultats : L’outil de visualisation a aidé les experts à identifier des facteurs de risque d’ouverture de ligne et d’engager des actions de corrections avec un gain estimé à 1000 interventions.

ORANGE - ORANGE

Telecommunications

Data Scientist

Arcueil, France

November 2016 - March 2018

Projet 3 : « Prévisions d’activités des interventions techniciens » : Calculer les prévisions d’activités des demandes de mise en service de lignes client et de maintenance (SAV) afin d’anticiper l’adéquation activité/ressource optimale, à destination de l’ensemble des 24 unités opérationnelles en région.

Activités :
• Collecter les flux historiques d’intervention et les données externes (météo, événement calendrier)
• Analyser les séries temporelles des flux d’intervention et les impacts des évènements externes
• Phase d’expérimentation : construire les modèles statistiques de prévisions dans la
• Phase d’industrialisation : automatiser la chaîne de traitement de collecte des données et de modélisation afin de simplifier la production récurrente des prévisions en termes de fréquence de production, du nombre de flux et de régions (3 flux sur 24 régions)

Résultats : Les modèles de prévisions ont aidé à réduire les écarts aux prévisions en dessous de 12% contre plus de 20%, en moyenne par rapport à l’existant. L’automatisation permet de réaliser une efficacité opérationnelle importante avec un gain estimé à 1 Équivalent Temps Plein (1 ETP) / semaine et région.

ENEDIS (Ex ERDF) - Enedis

Energy & Utilities

Data Scientist

Nanterre, France

October 2015 - September 2016

Entité : Pôle Données au sein de la DSI, département LAQ

Contexte : « Maintenance prédictive de serveurs applicatifs » : détecter les anomalies de fonctionnement de services des serveurs applicatifs et fournir des recommandations de maintenance à destination de l’opérateur informatique.

Activités :
• Réaliser les ateliers d’expression de besoins avec le métier pour comprendre sa problématique
• Collecter les flux de données des événements applicatif et système
• Traiter les données textuelles pour extraire les informations des fichiers de log
• Réaliser une classification des messages d’évènements en appliquant l’algorithme de K-Means et par analyse syntaxique
• Élaborer un modèle de régression logistique

SYNALTIC

Digital Agency and IT company

Data Scientist

Vincennes, France

April 2015 - September 2015

Entité : Département de Recherche et Développement

Contexte : « Segmentation clientèle d’un réseau de pharmacies » : Typologie des clients en fonction des caractéristiques et comportements d’achats

Activités :
• Collecter les données de tickets d’achats et les intégrer dans le système de fichier (HDFS) et dans les bases de données
• Enrichir la base de données avec les données géographiques et les catégories des produits pharmaceutiques
• Réaliser les analyses descriptives des comportements d’achats
• Mettre en œuvre la classification des profils client en utilisant la méthode des « K-Means »
• Restituer les typologies de clients en fonction de la catégorie de produits, du volumes et des fréquences d’achats

Education

charter modal image

Success is a team effort

Contribute to this success and the community's professionalism by signing the Freelancer Code of conduct

Sign the code