Bonjour,
Je suis Data scientist | ML Engineer et j'ai l'habitude de gérer une variété de pipelines de données et de bases de données, y compris des données non structurées. J'ai prototypé plusieurs produits from scratch.
○ Principes du code propre : Design patterns, POO, Pylint, PEP8, modules, documentation, tests unitaires
○ Construire de workflow de modèle reproductible de Machine Learning
○ Déploiement de pipeline ML évolutif en production
○ Scoring & Monitoring des modèles Machine Learning
Technologies et frameworks principalement utilisés :
○ Data science : Python | PySpark | Pandas | Numpy | Scipy
○ Machine learning : Azure | Databricks | Python | Tensorflow | Pytorch | Scikit-learn | Mlflow
○ Natural Language Processing : NLTK | SpaCy
○ Outils et frameworks web : Django | Flask | Django Rest API | FastAPI | Docker
○ Scrapping : Python, Requests, Selenium, Scrapy
○ Base de données : MySQL, Postgres
○ Gen AI : Azure Open AI, LLM, RAG, Agents, LangChain
○ Outils de versioning : Azure DevOps | Github | Gitlab | CI/CD