You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Darius G.DG

Darius G.

ML Engineer

€520/day
Lille, FR
3-7 years

Average response time: 1 hour

About Darius

Portfolio: dariusgros.dev
Site: ourkat-technologies.fr
Ressources et blog: ourkat-technologies.fr/blog

Ingénieur ML/Data avec 5 ans d'expérience, dont une forte composante MLOps : industrialisation de pipelines, CI/CD,
versioning, reproductibilité et déploiement de modèles sous contraintes (RGPD, données sensibles, infrastructure
souveraine). Habitué à analyser des modèles existants pour identifier des axes d'amélioration (performance, fiabilité,
coûts) et à intégrer des modèles HuggingFace dans des produits réels via Docker. Maîtrise solide de Python, des
pipelines de données à grande échelle (Spark, Delta Lake, Airflow) et des bonnes pratiques d'ingénierie logicielle
(architecture hexagonale, TDD, SOLID). Autonome, curieux, à l'aise dans des équipes techniques resserrées. Si seul sur projet, je peux own le produit fullstack (back, ml/dl et front).

Compétences clés
Machine Learning & Deep Learning : Python, PyTorch, scikit-learn, classification, régression, cluster-
ing, feature engineering, augmentation de données, cross-validation, optimisation de seuil, fonctions de perte,
prévision, tests A/B.

IA / LLM / NLP : Fine-tuning (CamemBERT, QLoRA), transfer learning, RAG, LangGraph, LangChain,
prompt engineering, embeddings, pgvector, ChromaDB, Claude API, Ollama, HuggingFace Transformers, analyse de sentiment, classification de texte

MLOps & Expérimentation : MLflow, suivi d’expériences, versioning de modèles, feedback loops, entraîne-
ment config-driven, sweep de seuils, prévention du data leakage, reproductibilité, packaging Docker, monitoring

Data Engineering : Apache Spark, Delta Lake, Databricks, Airflow, PostgreSQL, BigQuery, Redshift, pipelines
ETL, modélisation de données

Backend & Infrastructure : FastAPI, Pydantic, API REST, WebSocket, architecture hexagonale, TDD,
SOLID, Docker, Traefik, MFA/OTP, conformité RGPD

Cloud & DevOps : AWS, GCP, GitHub Actions, CI/CD, déploiement VPS

Languages : Python, SQL, Scala, R
  • English

    Native or bilingual

  • French

    Native or bilingual

Can work on-site
Lille (up to 10km), Nantes (up to 10km), Paris (up to 10km)

Experience

  • Ourkat Technologies
    Ingénieur ML / IA (Freelance), Ourkat Technologies
    CONSULTING AND AUDITS
    February 2026 - Today (5 months)
    Lille, France
    Systèmes IA de bout en bout pour PME. 3 projets ML + 2 sites web livrés.

    • Conception d’un pipeline ML complet : ingestion, segmentation documentaire, embeddings, recherche par similarité avec pgvector, évaluation et génération. Orchestration LangGraph en architecture hexagonale.
    • Système RAG hybride (BM25 + recherche de proximité pgvector) pour citation automatique de sources dans les rapports générés. Architecture deux couches : squelette de rapport généré par code + module de rédaction IA optionnel activé après validation métier.
    • Industrialisation avec packaging Docker, intégration FastAPI, PostgreSQL, déploiement sur infrastructure souveraine et CI/CD.
    • MLOps : observabilité avec Langfuse, fine-tuning QLoRA, optimisation des coûts d’inférence et de la latence API.
    → Pipeline RAG pour citation automatique de documents techniques. Rédaction IA conditionnelle avec validation métier.
    Langchain RAG LangFuse NLP PostgreSQL
  • Ourkat Technologies
    Co-fondateur & Lead ML/Backend — Korus
    FILM AND AV
    January 2026 - May 2026 (4 months)
    Lille, France
    • Fine-tuning DistilCamemBERT pour classification binaire de contenu toxique (recall > 0.95). 6 catégories
    de détection, seuil optimisé à 0.3, weighted CrossEntropyLoss.
    • Pipeline de génération de données multi-source : données synthétiques Ollama, web scraping, augmentation
    adversariale (leetspeak, unicode confusables, zero-width chars). Split train/test/val avant augmentation.
    Zéro data leakage.
    • Framework d’expérimentation config-driven (YAML + MLflow), versioning de modèles avec rollback. Feed-
    back loop production : faux négatifs signalés par opérateur réintégrés au training.
    • Backend temps réel avec FastAPI, WebSocket et PostgreSQL, déployé sur VPS souverain UE, conforme
    RGPD, sans dépendance cloud US.
    → Modèle fine-tuné en production. Pipeline de modération 3 couches dimensionné pour 100 à 5 000 participants.
    Docker Python CI/CD Management GitHub NLP
  • Client PME confidentiel
    Consultant IA, Automatisation documentaire
    ENERGY AND UTILITIES
    December 2025 - February 2026 (2 months)
    Paris, France
    • Déploiement d’un système hybride parsing + LLM pour conversion automatique de rapports PDF techniques
    (géotechnique, multi-fournisseurs) en JSON/Excel structurés. Prompts modulaires de 300+ lignes avec
    validation par contraintes physiques du domaine.
    • Optimisation tokens : extraction text-based via pdfplumber (pas de vision API), traitement page par page.
    Stratégie de rejet conservateur privilégiant la précision.
    • Infrastructure complète : VPS, Docker, intégration API LLM, authentification MFA/OTP, conformité
    RGPD. Interface Gradio adoptée au quotidien par les équipes métiers.
    → Traitement manuel intégralement automatisé. ~30 % d’économies sur les coûts API LLM.
    Docker External API integration Airflow AI and Advanced Analytics Python

Recommendations

Be the first to recommend Darius

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master MIASHS Machine Learning
    Université de Lille
    2022
    Relevant coursework: Time Series Forecasting, Advanced ML Algorithms, Mathematical Optimization, Cloud Computing
  • Bachelor In Applied Mathematics & Minor in Economics
    Wingate University
    2020
    Relevant coursework: Data Analysis, Advanced Statistics, Econometrics, Economic Forecasting Models

Skill set

Categories