You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Simon RochwergSR

Simon Rochwerg

Expert Web Scraping & Automatisations complexes

€450/day
50 projects
Paris, FR
8-15 years

Average response time: 1 hour

About Simon

🕷️ Scraping web dès 150€ par site -> site difficile, blocage, résolution de captchas.

Je vous aide à transformer n’importe quel site web en flux de données propre, structuré et exploitable (marche aussi depuis les application ios et android ✨)

Avec 10 ans d’expérience et plus de 500 entreprises accompagnées, je conçois des systèmes de scraping robustes et maintenables en production.

Je mets en place des solutions automatiques qui :

✔️ Collectent les données à intervalles réguliers
✔️ Gèrent les erreurs et blocages automatiquement
✔️ Détectent les changements de structure
✔️ Maintiennent la stabilité dans le temps
✔️ Produisent des données propres, normalisées et exploitables
✔️ Exploitable via API

Que ce soit pour générer des leads, surveiller des concurrents, suivre un marché ou nourrir des agents IA, je construis des solutions adaptées à vos objectifs.

🔎 Exemples de projets :

- Google Maps (génération de leads)
- Google Search
- LinkedIn & Sales Navigator
- Indeed (offres d’emploi)
- Immobilier (SeLoger, PAP, Idealista, Leboncoin)
- Réseaux sociaux (Instagram, YouTube, Twitter…)

🛡️ Expertise environnements protégés :

- DataDome
- Cloudflare
- PerimeterX / HUMAN
- reCAPTCHA, hCaptcha, Geetest
- Captchas complexes & détection comportementale, fingerprinting

⚙️ Méthodologie production :

- Architecture scalable
- Rotation IP intelligente
- Gestion d’empreinte navigateur
- Monitoring & alerting
- Auto-corrections en cas d’erreur
- Nettoyage, normalisation et structuration des données
- Export CSV / API / base de données

💡 Objectif : vous fournir des données fiables et directement exploitables par vos équipes (ou vos modèles LLM ✨)

🎓 Master 2 Intelligence Artificielle – École des Ponts
  • English

    Fluent

  • French

    Native or bilingual

  • Spanish

    Conversational

Remote only
Primarily works remotely

Experience

  • LBF
    Malt logoOn Malt
    Base de données B2B des bars et restaurants à Paris + 92/93/94/95 avec emails vérifiés + téléphones
    RESTAURANTS AND FOOD SERVICE
    October 2025 - November 2025 (1 month)
    Paris, France
    🚀 Scraping & Qualification – Restaurants (Paris + IDF)

    Mise en place d’un pipeline IA pour constituer une base ultra qualifiée de bars & restaurants (Google Maps + Uber Eats).

    Réalisations :
    • Identification du site officiel (exclusion marketplaces)
    • Extraction emails pro + mobiles 06/07
    • Scoring intelligent des emails (priorisation des contacts exploitables)
    • Vérification MX/DNS/SMTP pour réduire les bounces
    • Fusion & dédoublonnage multi-sources
    Résultat :
    • Base propre, structurée et prête CRM
    • Taux de délivrabilité optimisé
    • Campagnes d’outreach plus performantes
    Livrable : CSV/XLSX structuré + traçabilité des sources.
    Web Scraping Prospection B2B Google Maps Google Maps API n8n
  • Geoplanete France SAS
    Malt logoOn Malt
    Automatisation catalogue produits Shopify (scraping + IA + intégration Matrixify)
    E-COMMERCE
    September 2025 - November 2025 (2 months)
    Paris, France
    🧩 Automatisation catalogue Shopify – Geoplanete (Website → Shopify)

    Mise en place d’un pipeline complet pour automatiser l’intégration du catalogue produits vers Shopify.

    Réalisations :
    • Développement d’un scraper robuste (produits, variantes, accessoires, images, PDF techniques)
    • Normalisation et nettoyage avancé des données (attributs, prix, poids, SEO, métadonnées)
    • Enrichissement automatisé des descriptions et FAQ via GPT-5 (prompt engineering + fiabilisation)
    • Génération du catalogue via Matrixify (stocks, métachamps, marques, relations produits)
    • Import en Draft dans Shopify pour validation (50+ produits testés)
    • Mise en place d’un process réplicable pour futurs fournisseurs
    Résultat :
    Un pipeline automatisé permettant d’importer des centaines de produits propres et enrichis en quelques minutes, supprimant la saisie manuelle et rendant l’ajout de nouveaux catalogues scalable.
    Développement Shopify Développeur Shopify boutique shopify Automatisation Automatisation des tâches
  • Expertual invest SL
    Malt logoOn Malt
    Data Engineer & Développeur Python — scraping et structuration de documents fiscaux, pipeline RAG
    SOFTWARE PUBLISHING
    July 2025 - August 2025 (1 month)
    Paris, France
    - Collecte & parsing de documents fiscaux espagnols (PDF/HTML) avec pipeline robuste (retries, logs).

    - Nettoyage / normalisation des métadonnées (période, émetteur, type de document).

    - Indexation : base Postgres + schéma optimisé, stockage des fichiers et contenus.

    - Résumé & classification automatiques via OpenAI (labels métiers + synopsis par document).

    - Synchronisation Airtable pour consultation et suivi (~60 000 docs).

    - Qualité & industrialisation : tests, monitoring, alerting, scripts de reprise.

    - Préparation phase 2 : conception d’un chatbot RAG (recherche sémantique, historisation, permissions).

    Stack principale : Python, FastAPI, Playwright/Requests, BeautifulSoup, PostgreSQL (+pgvector), OpenAI API, Airtable API, Docker, CI/CD.
    RAG Retrieval-Augmented Generation (RAG) OpenAI Prompt engineering intelligence artificielle

Reviews

5,0

Out of 39 ratings

J

Julien

Mighty Nine

Reviewed on 18/11/2025

Je recommande à 100% Simon. Pro, réactif, rapide, sérieux.
T

Théobald

Geoplanete France SAS

Reviewed on 18/11/2025

Un vrai plaisir de travailler avec Simon sur cette mission. Un sens du professionnalisme aigu, un suivi précis de chaque étape et des prochaines avancées. En plus d'un travail parfaitement finalisé, nous avons apprécié la force de proposition et de solution, dont a fait preuve Simon tout au long du projet.

Simon has chosen to hide 1 review

1 written review is private.

Recommendations

Be the first to recommend Simon

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master Ingénierie Financière
    Université Paris Dauphine
    2016
    Modèles probabilistes, produits dérivés.
  • Machine Learning (intelligence artificielle)
    Ecole Nationale des Ponts et Chaussées
    2017
    Neural Networks, SVM, k-means, spectral clustering

Skill set

Categories