About Julien
English
Fluent
French
Native or bilingual
Italian
Conversational
Experience
- LeihiaData ScientistJuly 2020 - July 2020Rueil-Malmaison, Île-de-France, FranceMise en place d’un algorithme d’intelligence artificielle pour faire matcher le Candidat idéal pour le bon job dans la bonne entreprise.
- Projet d'étudesData Scientist - AWSJanuary 2020 - March 2020 (2 months)Mennecy, Île-de-France, FranceDéployez un modèle dans le Cloud Préparation d’un modèle de classification d’images en tenant compte d’une future mise à l’échelle des calculs due à l’augmentation du volume de données. Outils utilisés : - Langage : Python 3.6 - Environnement : Linux Mint – VirtualEnv – JupyterLab – AWS – Git & GitHub - Librairies : Spark 2.4.5 – OpenCV – Boto3 Travaux réalisés : - Code : - Preprocessing d’un modèle de classifieur par chargement des images dans un dataframe Spark. - Extraction des descripteurs de chaque image avec l’algorithme ORB inclut dans OpenCV. - Enregistrement du dataframe final au format parquet. - Déploiement sur AWS : - Création d’un dépôt S3, avec AWS CLI et sans. - Création d’une instance EMR pour la distribution des calculs. - Configuration des rôles dans AWS IAM. - Utilisation d’un Notebook EMR pour charger et visualiser les résultats.
- Projet d'étudesData Scientist - AzureDecember 2019 - January 2020 (1 month)Mennecy, Île-de-France, FranceImplémentez un modèle de Scoring Prédiction de risque de faillite d’un client pour une entreprise de crédits. Outils utilisés : - Langage : Python 3.7.5 - Environnement : Windows – VirtualEnv – JupyterLab – Microsoft Azure – Git & GitHub - Librairies : Pandas – Numpy – Matplotlib – Seaborn – Scikit-Learn – imblearn – XGBoost – Streamlit – Flask – Docker Travaux réalisés : - Classification binaire sur un jeu de données déséquilibré. - Preprocessing des données avec rééquilibrage des données. - Essai de plusieurs modèles : Régression logistique – Random Forest – Xgboost. - Optimisation du modèle le plus prometteur. - Etudes des différentes métriques : Accuracy – Precision – Recall – F1Score - Matrice de confusion – Courbe ROC – Score AUC – Features Importances - Réalisation d’un Dashboard avec Flask et Streamlit. - Déploiement du modèle sur Microsoft Azure : Docker – Registry – Azure Service Plan – Web App Service – Azure CLI - Voir mon article LinkedIn expliquant en détails la procédure
Recommendations
Be the first to recommend Julien
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Data ScientistOpenClassRooms2020Parcours Data Scientist sur la plateforme OpenClassRooms : https://openclassrooms.com/fr/paths/164-data-scientist Ce parcours est constitué de sept projets professionnalisant dont vous pouvez voir le détail dans le lien ci-dessus. Chacun de ces projets contient sa spécificité, ce qui m'a permis d'acquérir des compétences dans : - Python - Jupyter Notebook - Environnements virtuels - Le Data Mining ( Analyse, Compréhension, Nettoyage, Mise en forme, Visualisation des données) - La régression supervisée, non supervisée - La classification supervisée, non supervisée - Le clustering - Le traitement de texte et d'image - Le développement d'API - La création de Dashboard - Le déploiement sur le Cloud - Le Big Data
- Data ScientistOpenClassrooms2020Huit projets professionnalisant à valider auprès d'un jury : - Analyse exploratoire de base de données. Aide décisionnelle d’expansion à l’international d’une entreprise de cours en ligne. - Proposition d’application en lien avec l’alimentation. - Prédiction de conso de CO2 et conso totale des bâtiments de Seattle en se basant sur des bases de données existantes. - Comprendre les différents types d’utilisateurs grâce à leur comportement et à leurs données personnelles. Evaluer la fréquence à laquelle la segmentation doit être mise à jour. - Réaliser une première étude de faisabilité d'un moteur de classification en se basant sur une image et une description pour l’automatisation de l’attribution de la catégorie de l’article. - Prédiction de risque de faillite d’un client pour une entreprise de crédits. - Préparation d’un modèle de classification d’images en tenant compte d’une future mise à l’échelle des calculs due à l’augmentation du volume de données.
Certifications
- SQL pour la Data Science de A à Z (analyse de data réelles)Udemy2020