You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Julien CardiJC

Julien Cardi

Freelance IA | Expert LLM & RAG | Python · FastAPI

€500/day
Paris, FR
3-7 years

Average response time: 1 hour

About Julien

90% des PoC IA meurent avant la prod.
Causes : architecture usine à gaz, coûts d'inférence (OpenAI/Gemini) explosifs, latence et zéro monitoring.


Ingénieur IA & Backend, je ne crée pas de prototypes jetables. Je reconstruis des pipelines LLM lents, coûteux ou instables pour les faire scaler en production.


J'accompagne les Startups & Scale-ups qui bloquent sur l'exécution technique et l'infra de leurs projets AI.


► MON APPROCHE :
La simplification. Je supprime les couches inutiles (ex: remplacer un RAG complexe + Redis par un pipeline asynchrone Kafka + Prompt Engineering solide). J'implémente un routing intelligent pour diviser vos coûts par 3 et un vrai LLMOps pour une observabilité totale.


► CE QUE JE METS EN PLACE (Stack & Expertise) :
  • Backend & Infra : Python, FastAPI, Pydantic v2, asyncio, Kafka, S3, PostgreSQL, Redis.
  • Ingénierie LLM : LangGraph, Function Calling, Schema-first JSON, Prompt Engineering, Routing multi-modèles (Gemini 2.5, OpenAI).
  • LLMOps & Monitoring : Tracking tokens/coûts, Rate-limiting, DLQ, Prometheus, Grafana.
  • Déploiement : Docker, Kubernetes (K8s), AWS (EKS, Bedrock), vLLM, RunPod, CI/CD.
► RÉSULTATS CONCRETS :
  • Pipeline d'extraction (Scale-up SOLV) : Remplacement d'un système instable par une archi Kafka minimaliste. 50k+ docs traités, 99.2% de succès, coûts d'API ÷3.
  • Clustering à contraintes IA : Conception d'un algo hybride scalable là où DBSCAN/K-Means échouaient sémantiquement.
  • Automatisation (Venio AI) : Plateforme d'agents livrée en prod via spec OpenAPI.

💡 "Exécution de niveau senior dès le premier jour — livraisons transverses sur le backend, le DevOps et l’ensemble du stack IA." — Luca F. (CTO, Venio AI)


► MODALITÉS :
• Full remote (Fuseau EU) | Missions 3-6 mois | Dispo immédiate.


On regarde sous le capot de votre infra LLM ? Contactez-moi.
  • French

    Native or bilingual

  • English

    Fluent

  • Spanish

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • SOLV
    Production LLM Engineer
    October 2025 - Today (8 months)
    Bruxelles, Belgium
    Scale-up belge de stakeholder analytics & risk management pour projets d'infrastructure complexes.


    Pipeline d'extraction documentaire LLM :
    Reconstruction complète d'un pipeline d'extraction instable (Redis + embeddings + RAG + modèles premium, crash à 10+ docs) par un système Kafka async minimaliste en Python/FastAPI.
    → 50 000+ documents traités, 99.2% succès, coût divisé par 3


    Algorithme de clustering à contraintes :
    Conception et implémentation d'un algorithme hybride : extraction de features par LLM (orientation, entités, nature) injectées comme pénalités dans la matrice de distance avant clustering hiérarchique. A résolu les limites de deux tentatives précédentes (DBSCAN, HDBSCAN+K-Means).


    Routing multi-modèles & LLMOps :
    Routing intelligent Gemini Flash ↔ Gemini 2.5 Pro (fallback OpenAI), sélection selon complexité/coût. Dashboards Prometheus/Grafana en production (p95 latence, coûts, densité d'extraction), rate-limiting, retries exp-backoff, DLQ.
    LLM Python LLMOps RAG Langchain
  • Venio AI
    AI Engineer
    February 2025 - September 2025 (7 months)
    Reggio d'Émilie, Italy
    Startup d'automatisation par agents IA pour entreprises non-tech.


    Plateforme d'agents conversationnels :
    Construction en Python/FastAPI d'une plateforme d'agents LLM : le système comprend le besoin utilisateur en langage naturel, génère un agent adapté et expose un endpoint API prêt à l'emploi. Génération automatique d'outils agents depuis specs OpenAPI.


    Benchmarking & déploiement :
    Suite de benchmarking (accuracy, coût, latence) pour comparer modèles LLM et prompts avant mise en production. Déploiements automatisés Docker/Kubernetes via GitLab CI/CD.
    FastAPI Docker Python LLM Agent IA
  • ONECLICKHIRED
    Fondateur
    January 2025 - September 2025 (8 months)
    SaaS IA : parsing de CV + outreach personnalisé automatisé. Stack complète construite en solo : React/TS, Fastify, PostgreSQL, Redis/BullMQ, Stripe.


    Intégration LLM multi-providers (Gemini + OpenAI), jobs asynchrones fiables. 150 inscriptions.
    LLM PostgreSQL intelligence artificielle

Recommendations

Be the first to recommend Julien

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Ingénieur, IA
    EPITA
    2025
    Ingénieur, IA
  • MP
    CPGE N.D. de Sion
    2022
    MP

Skill set

Categories