Pourquoi ce guide existe
Tous les mois, je reçois la même question de la part de growth managers B2B : "C'est vrai qu'on n'a plus le droit de scraper LinkedIn ?". La réponse courte : si, tu as le droit. Mais sous conditions, et la marge entre légal et problématique est plus fine qu'en 2023.
Ce guide couvre trois choses :
- Ce que dit vraiment le droit (RGPD + arrêt HiQ vs LinkedIn)
- Ce que LinkedIn fait pour bloquer les scrapeurs techniquement
- Les méthodes qui marchent encore en 2026, avec leurs limites
Le cadre légal : ce qui a changé
L'arrêt HiQ Labs v. LinkedIn (9ème Circuit US, confirmé en 2022) a établi que scraper des données publiques ne viole pas le Computer Fraud and Abuse Act. Autrement dit : si un profil est visible sans être connecté, le scraper n'est pas un pirate.
Côté européen, la CNIL a publié en 2023 ses lignes directrices sur le web scraping. L'essentiel en une phrase : tu peux scraper des données publiques, mais tu dois respecter le RGPD dès que tu les traites.
Concrètement, ça veut dire :
- Tu dois avoir une base légale (intérêt légitime pour du B2B, en général)
- Tu dois informer les personnes dont tu traites les données (article 14 RGPD)
- Tu dois leur laisser un moyen de s'opposer
- Tu ne peux pas stocker indéfiniment
Ce que LinkedIn fait techniquement
LinkedIn a empilé plusieurs couches de défense depuis 2024 :
- Rate limiting agressif sur les profils publics (100 vues/jour sans compte)
- Détection de navigateur automatisé via fingerprinting (canvas, WebGL, timings)
- Challenges captcha dès que tu sors de la normale
- Bans IP sur les datacenters connus (AWS, GCP, Hetzner)
- Watermarking invisible des données servies pour tracer les fuites
Résultat : les méthodes "scripts Python + proxies datacenter" qui marchaient en 2022 ne passent plus. Il faut des proxies résidentiels rotatifs, du fingerprinting réel, et souvent des comptes LinkedIn actifs.
Les méthodes qui marchent en 2026
1. Sales Navigator via session authentifiée
La méthode la plus robuste. Tu utilises un compte Sales Navigator, tu automatises via un navigateur headless avec une stack fingerprint-proof, et tu extrais les résultats de recherche.
- Avantages : volumes élevés (jusqu'à 2500 leads par recherche), données riches (titre, entreprise, secteur, taille)
- Inconvénients : coût du compte (100€/mois), risque de ban du compte si trop agressif, nécessite du code
- Coût réaliste : 10 à 15$ pour 1000 leads, hors abonnement
2. Annonces recrutement comme proxy
Une technique sous-utilisée : LinkedIn Talent affiche les profils qui correspondent à tes offres d'emploi. Tu peux donc cibler "profils ayant ces skills dans cette zone" sans payer Sales Navigator, si tu as un compte recruiter.
3. Exports Sales Nav officiels + enrichment
Si tu as Sales Nav et que tu cherches du volume one-shot, les exports CSV officiels sont limités à 25 lignes par recherche, mais tu peux combiner avec un enricher (Clearout, Dropcontact, Betterleads) pour récupérer les emails.
Ce que je recommande aux clients
Pour la plupart des équipes growth B2B, la meilleure approche n'est pas de gérer le scraping en interne. Les raisons :
- Le mainten technique coûte cher (IPs, fingerprints, monitoring)
- Un ban coûte plus cher qu'un scraping managé
- Les équipes legal vont demander des garanties RGPD
On livre ce type de données en 48h à 5 jours ouvrés selon le volume, avec enrichment email (taux ~70%) et conformité RGPD incluse.
Conclusion
Scraper LinkedIn en 2026 est encore possible, mais ce n'est plus un terrain pour les bricoleurs. Si tu as besoin de données récurrentes ou de gros volumes, délègue. Si tu veux tester à petite échelle, prends un compte Sales Nav et utilise un outil comme Phantombuster ou Evaboot pour commencer.
La clé : respecte les personnes. Une base de 10 000 leads bien ciblés et enrichis vaut 10x plus qu'une base de 100 000 leads dégueulasse. Et le RGPD te l'impose de toute façon.