Kernaussagen
- ✓ Drei Wege, Amazon-Rezensionen 2026 zu extrahieren: DIY Python (billig, fragil), No-Code-Scraper (schneller Start), Managed Delivery (schnellstes Ergebnis).
- ✓ Amazon limitiert öffentliche Bewertungsseiten auf etwa 100 pro Produkt (~1.000 Rezensionen). Alles darüber erfordert die Seller-API oder Reverse-Engineering der Mobile-App-Endpunkte.
- ✓ Der echte Gegner ist nicht das HTML-Parsing, sondern die Anti-Bot-Architektur: Datacenter-IPs werden in 30 Requests captcht, Residential-Proxies kosten 5 bis 15 € pro GB.
- ✓ Kosten für 10.000 Bewertungen: DIY 15-40 € Proxies, ScraperAPI ~80 €, Apify ~8 €, Managed 150-300 €.
- ✓ Unter 1.000 Rezensionen einmalig: Chrome-Erweiterung. 10.000 bis 100.000 wiederkehrend: Apify. Wöchentliche Pipelines ohne Wartung: den Output kaufen.
Ein Amazon-Review-Scraper extrahiert strukturierte Daten (Bewertung, Autor, Datum, Text, Verifiziert-Flag) von Produktbewertungsseiten in CSV oder JSON. Das Werkzeug-Ökosystem hat sich 2026 in drei Kategorien aufgeteilt, und die Wahl hängt fast ausschließlich vom Use Case ab, nicht von den Tools selbst.
Dieser Guide deckt die drei Methoden ab, die Anti-Bot-Realität von Amazon, realistische Kosten pro 10.000 Bewertungen, rechtliche Rahmenbedingungen und vier konkrete Use Cases mit Verdikt.
Was extrahierbar ist (und was nicht)
Amazon-Produktbewertungsseiten zeigen mehr, als man denkt, aber weniger als früher.
Extrahierbar
- ✓ Sternebewertung (1 bis 5)
- ✓ Titel und Bewertungstext
- ✓ Anzeigename und Profil-URL
- ✓ Datum und Verifiziert-Badge
- ✓ Hilfreich-Stimmen
- ✓ Variantenattribute (Größe, Farbe)
- ✓ Bild- und Video-URLs
- ✓ Top-Positiv- und Top-Kritisch-Highlights
Nicht extrahierbar
- ✗ E-Mail oder Telefonnummer
- ✗ Historische Rezensionen jenseits Seite 100
- ✗ Private Vine-Pre-Release-Bewertungen
- ✗ Händlerantworten (marketplaceabhängig)
- ✗ Retouren-/Rückerstattungsmetadaten
- ✗ Cross-ASIN-Reviewer-Historie
- ✗ Gelöschte oder moderierte Bewertungen
- ✗ A-bis-Z-Garantieansprüche
Wichtig: Amazon serviert unterschiedliche Rezensionen je marketplace (amazon.de, amazon.com, amazon.co.uk, amazon.fr). Bewertungen auf DE- und US-Listings überschneiden sich nicht. Für eine globale Produktsicht muss jeder Marketplace separat gescrapt werden.
Methode 1 — Python + Requests (DIY)
Der DIY-Weg funktioniert für kleine Volumen und kurzlebige Skripte. In Produktion bricht er schnell, weil Amazons Anti-Bot-System jedes Quartal zulegt.
import requests
from bs4 import BeautifulSoup
import time, random, json
HEADERS = {
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.0 Safari/605.1.15",
"Accept-Language": "de-DE,de;q=0.9,en;q=0.8",
}
def fetch_reviews(asin: str, max_pages: int = 10) -> list[dict]:
reviews = []
for page in range(1, max_pages + 1):
url = f"https://www.amazon.de/product-reviews/{asin}?pageNumber={page}"
r = requests.get(url, headers=HEADERS, timeout=15)
if r.status_code != 200:
break
soup = BeautifulSoup(r.text, "html.parser")
for b in soup.select('div[data-hook="review"]'):
reviews.append({
"note": b.select_one('i[data-hook="review-star-rating"]').text.split()[0],
"titel": b.select_one('a[data-hook="review-title"]').text.strip(),
"autor": b.select_one('span.a-profile-name').text.strip(),
"datum": b.select_one('span[data-hook="review-date"]').text.strip(),
"verifiziert": bool(b.select_one('span[data-hook="avp-badge"]')),
"text": b.select_one('span[data-hook="review-body"]').text.strip(),
})
time.sleep(random.uniform(1.5, 3.5))
return reviews
Anti-Bot-Realität
Eine einzelne Datacenter-IP (AWS, Hetzner, OVH) wird nach 10 bis 30 Requests captcht. Eine Residential-IP hält 200 bis 500 Requests. Residential-Rotation liefert je nach Provider 5 bis 15% Fehlerquote.
Um über die Captcha-Wand zu kommen, braucht es rotierende Residential-Proxies (Bright Data, Oxylabs, Smartproxy, Soax), realistische Header, TLS-Fingerprint-Spoofing (curl_cffi) und Backoff-Logik. Aus dem "einfachen Skript" werden 400 Zeilen Python mit Retry-Queue.
DIY sinnvoll: einmalige Extraktion unter 1.000 Rezensionen, Python-Entwickler im Team, keine wiederkehrenden Updates nötig.
DIY bricht: jeder Produktionsworkflow mit Frischeanforderung und jemandem, der Selektoren jede 8 bis 12 Wochen fixen muss.
Methode 2 — No-Code-Scraper
Chrome-Erweiterungen
Tools wie Amazon Review Exporter oder Helium 10 funktionieren auf der geöffneten Produktseite. Klick, Warten, Download. Gut für ein ASIN, nutzlos im Batch. Preise von kostenlos bis 29 €/Monat.
Apify — Amazon Reviews Scraper
Der Apify-Actor ist die kampferprobteste No-Code-Option für Volumen. ASINs einfügen, Seitenanzahl festlegen, laufen lassen. Output: JSON, CSV oder Excel. Preis etwa 0,80 € pro 1.000 Rezensionen inklusive Proxies. Apify-Team patcht den Actor, wenn Amazon die Seiten ändert.
Outscraper
Outscraper bietet einen ähnlichen Batch-Endpunkt mit Free-Tier (500 Rezensionen) und kostenpflichtigen Stufen um 30 € pro 10.000. Weniger flexibel, einfacher für Nicht-Techniker.
ScraperAPI / Zyte / Oxylabs
API-first: URL senden, HTML zurückbekommen (Proxy und Captcha gelöst). Sie parsen das HTML selbst. Sinnvoll, wenn Parser vorhanden, aber keine Proxy-Infrastruktur gewünscht ist. Etwa 49 €/Monat für 100.000 API-Aufrufe.
| Tool | Preis / 10k | Ideal für | Schwäche |
|---|---|---|---|
| Chrome-Erweiterung | ~0 bis 10 € | Ein Produkt, manuell | Kein Batch, keine API |
| Apify Actor | ~8 bis 12 € | Wiederkehrend | Setup erforderlich |
| Outscraper | ~30 € | Nicht-Techniker | Festes Schema |
| ScraperAPI | ~15 bis 30 € | Parser vorhanden | HTML selbst parsen |
| DIY Python + Proxies | ~15 bis 40 € | Einmalig, klein | Bricht alle 2 Monate |
Methode 3 — Managed Delivery
Der dritte Weg umgeht die Tool-Frage. Sie briefen das Ziel (ASINs, Marketplaces, Rezensionsanzahl, Frische), ein Team führt die Extraktion aus, Sie erhalten das CSV. Keine Proxies kaufen, keine Selektoren debuggen, keine Quotas managen.
Diese Methode gewinnt in drei Szenarien: One-Shot-Use-Case (Wettbewerbsanalyse, Produkt-Due-Diligence, Markteintritt), kein Entwickler, der die Scraping-Infrastruktur besitzen will, oder Daten-Budget kleiner als Engineering-Zeit.
Sie verliert, wenn Echtzeit-Updates (unter einer Stunde Frische) nötig sind oder wenn Sie dutzende Extraktionen pro Woche fahren und Volumenrabatte der Plattformen greifen.
Amazon-Daten schlüsselfertig
Bekommen Sie die Rezensionen, überspringen Sie die Proxies
Briefen Sie ASINs und Marketplaces. Erhalten Sie ein sauberes CSV in 48 bis 72 Stunden mit Bewertung, Autor, Datum, Text, Verifiziert-Flag und Hilfreich-Stimmen. Keine Konten, keine Infrastruktur.
Angebot anfordern →
Anti-Bot: Was wirklich blockiert
Amazon betreibt einen der anspruchsvollsten Anti-Bot-Stacks im E-Commerce.
IP-Reputation. Datacenter-IPs werden aggressiv geblockt. Residential-IPs von Consumer-ISPs passieren. Mobile-IPs (4G/5G) sind am sauberten, aber teuer.
Rate Limiting. Selbst saubere Residential-IPs werden ab ~2 Requests/Sekunde pro Session gedrosselt. Über 200 Requests ohne Cookie-Reset: leere Rezensionsblöcke.
Captcha. Nach Flag: Amazons eigenes Bildverzerrungs-Captcha. Solver wie 2Captcha und CapSolver lösen das für 0,001 bis 0,003 € pro Stück.
TLS-Fingerprinting. Pythons requests-Lib hat einen erkennbaren Fingerabdruck. curl_cffi (Chrome-TLS-Stack) umgeht das.
JavaScript-Challenges. Auf amazon.co.jp und teils anderen Marketplaces läuft ein JS-Challenge vor dem Rendering. Ohne Headless-Browser (Playwright) unmöglich.
Browser-Fingerprinting. Playwright/Puppeteer mit Defaults werden via navigator.webdriver, fehlendes chrome.runtime und Canvas-Anomalien erkannt. Stealth-Plugins decken den Großteil ab.
Recht und AGB
Öffentliche Amazon-Bewertungen sind öffentliche Daten. Das Scrapen ist in den USA unter der hiQ v. LinkedIn-Rechtsprechung (9th Circuit, 2022) legal.
Scraping verstößt jedoch gegen die Amazon-AGB, die "alle Daten-Sammlungs- und Extraktionswerkzeuge" verbieten. Das ist zivilrechtlich, nicht strafrechtlich. Amazons Durchsetzungspfad: IP sperren, Konto schließen, bei Schaden zivilklagen.
Für EU-Operationen greift die DSGVO, weil Reviewer-Namen personenbezogene Daten sind. Unter Art. 6(1)(f) DSGVO ist eine legitime Interessengrundlage nötig, und der Reviewer behält sein Recht auf Löschung. Die meisten Teams anonymisieren Namen bei Ingestion und behalten nur Text und Bewertung.
Für kommerzielle Nutzung der Daten (Weiterverkauf, Republikation, LLM-Training) gilt Urheberrecht für einzelnen Text. Aggregation und Analyse fallen unter Fair Use; direkte Republikation nicht.
4 konkrete Use Cases mit Verdikt
Use Case 1 — Wettbewerbs-Due-Diligence (einmalig, 500 Rezensionen × 10 Konkurrenten)
5.000 Rezensionen total. Verdikt: Managed Delivery oder einmaliger Apify-Run. DIY überdimensioniert. Chrome-Erweiterung zu langsam. Apify bei ~5 €, Managed bei 150-250 € schneller.
Use Case 2 — Amazon-Seller überwacht eigene Listings (täglich, 50 ASINs, ~200 Rezensionen/Woche)
~10.000 Rezensionen/Woche. Verdikt: Apify-Actor mit Scheduled Run + Webhook zum Data Warehouse. ~40 €/Monat. Frische-Fenster verhindern Re-Scraping.
Use Case 3 — Akademische Sentiment-Forschung (einmalig, 100.000 Rezensionen, 50 ASINs)
Großes Volumen, Einmalextraktion. Verdikt: ScraperAPI + eigener Parser oder Apify-Bulk-Run. Erwartete Kosten 80 bis 150 €. Managed overkill.
Use Case 4 — Markteintrittsstudie neue Kategorie (wiederkehrend, 500 ASINs, Monatssnapshot)
~50.000 Rezensionen/Monat. Verdikt: Managed Delivery mit Monatsvertrag, oder interner Data-Engineering-Setup mit ScraperAPI. Buy-vs-Build-Schwelle bei ~500 €/Monat.
FAQ
Ist das Scrapen von Amazon-Rezensionen legal? Öffentliche Bewertungsdaten sind in den USA legal zu scrapen (hiQ-Präzedenzfall). AGB-Verstoß zieht Konsequenzen auf Account-Ebene nach sich, nicht strafrechtlich.
Welcher Amazon-Review-Scraper ist der beste? Kein einzelnes Tool ist "der beste". Apify gewinnt bei wiederkehrendem Volumen, Chrome-Erweiterungen bei kleinen Einmal-Extraktionen, Managed-Services bei nicht-technischen Teams.
Wie viele Rezensionen pro Produkt? Amazon limitiert öffentlichen Zugriff auf ~1.000 pro ASIN. Mehr erfordert die Seller-API.
Brauche ich Proxies? Ja, über ~30 Requests von einer IP. Residential-Proxies (5 bis 15 € pro GB) sind Minimum für ernsthaftes Volumen.
Wie oft ändert Amazon das HTML? Größere Selektor-Änderungen alle 8 bis 12 Wochen. A/B-Tests wöchentlich.
Rezensionen in anderen Sprachen als Englisch? Ja. Amazon serviert Rezensionen in der Primärsprache des Marketplaces. Für amazon.de sind die Rezensionen auf Deutsch.
