About Rahul
Ne laissez plus vos modèles mourir en phase de POC.
💡 Ce que j'apporte concrètement à vos équipes
- Inférence LLM à grande échelle : Déploiement et optimisation de modèles via vLLM pour tenir des charges massives (ex : industrialisation de l'IA de support pour une administration publique majeure).
- Cost-Killing & Optimisation GPU : Réduction de la latence et de l'empreinte mémoire via la quantification, ONNX et le tuning des moteurs d'inférence.
- Infrastructures Critiques & Souveraineté : Création de clusters Kubernetes (EKS/GKE) hautement disponibles et déploiements sécurisés sur clouds souverains (Outscale, AWS) via Terraform et pipelines CI/CD stricts.
- Deep Tech & Bas niveau : Là où l'écosystème Python montre ses limites, je réécris les briques critiques en C++ ou Go pour garantir une performance système maximale.
🛠️ Stack & Écosystème
- IA & Data : Python, PyTorch, vLLM, ONNX, FastAPI
- Cloud & Infra : AWS, Outscale (SecNumCloud), GCP, Kubernetes, Docker
- DevOps : Terraform, GitHub Actions, GitLab CI
- Core & Performance : C++, Rust, Go
🎯 Pourquoi collaborer avec moi ?
French
Native or bilingual
English
Fluent
Experience
- TakerIngénieur Computer Vision & IACONSULTING AND AUDITSDecember 2025 - Today (6 months)Paris, FranceConception et optimisation de pipelines d'inférence avancés pour des problématiques complexes de traitement d'image.
- Inférence & State-of-the-Art (SOTA): Intégration, optimisation et mise en production de modèles de segmentation ultra-précis issus de l'état de l'art (SAM2 de Meta, RMBG).
- Pipeline de Computer Vision: Développement complet du pipeline d'isolation d'arrière-plan (Background Removal) avec des contraintes fortes de précision et de performance de calcul.
- Architecture en Microservices: Intégration de pipeline IA dans des infrastructure IT robuste en microservices.
- DatakeenMachine Learning Ops (MLOps)CONSULTING AND AUDITSApril 2025 - August 2025 (4 months)Paris, FrancePilotage de l’infrastructure technique et du cycle de vie des modèles LLM & Anti-fraude pour +20 clients grands comptes ou des administrations publiques.
- Déploiement LLM à l'échelle & Haute Performance (vLLM): J'ai orchestré la mise en production et l'optimisation de solutions LLM complexes (ex: industrialisation d'un modèle de classification pour une grande administration nationale). J'ai garanti une faible latence et une haute disponibilité en déployant ces modèles via vLLM et FastAPI.
- Architectures Critiques & Cloud Souverain: J'ai répondu aux exigences strictes de sécurité (isolation des données, traitement de documents sensibles) en concevant et déployant des architectures sur-mesure sur des environnements multi-cloud et souverains (AWS, SecNumCloud via Outscale/3DS, Scaleway), incluant la gestion de clusters GPU sous load-balancing (ex: pour un acteur majeur de l'assurance).
- Core Engineering & Optimisation Anti-Fraude: J'ai mené l'entraînement, l'optimisation et le déploiement de modèles de Deep Learning (classification, détection d'anomalies, OCR) dédiés à la lutte anti-fraude sur des titres d'identité, en assurant une mise à l'échelle pour les clients.
- Industrialisation CI/CD & Culture Ingénierie: J'ai fiabilisé et accéléré le rythme de livraison de l'équipe engineering en construisant des pipelines CI/CD automatisés. J'ai également rédigé la documentation technique de référence (Standard Operating Procedures) pour standardiser les pratiques de déploiement.
- Observabilité & Fiabilité en Temps Réel: J'ai assuré la robustesse des systèmes en production en implémentant des sondes de performance avancées, permettant le monitoring continu de l'infrastructure, le suivi de la dérive des modèles (data drift) et la garantie d'une marge opérationnelle optimale.
Cette expérience m’a permis de livrer des solutions robustes, scalables et maintenables, en étroite collaboration avec les équipes techniques. - Bal des fousBackend & Cloud EngineerENTERTAINMENT AND LEISUREJanuary 2026 - Today (5 months)Paris, FranceIntervention en tant que consultant technique sur l'architecture back-end et les fonctionnalités d'engagement pour une application de type réseau social.
- Architecture Temps Réel (FCM): Conception et implémentation d'un système de notifications push temps réel via Firebase Cloud Messaging, pensé pour supporter efficacement la charge et l'engagement des utilisateurs.
- Moteur de Cross-Posting: Développement et intégration d'un système de publication inter-plateformes complexe garantissant la synchronisation et la fiabilité des flux de données.
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Master of Science (PGE)EpitechMaster of Science (PGE)