Das Herunterladen vieler Bilder von einer Website kann ziemlich zeitaufwendig sein.
Rechtsklick, Bild speichern unter…, Wiederholung bis zum Gehtnichtmehr.
In diesen Fällen ist Web Scraping die Lösung für Ihr Problem. In diesem Tutorial wird gezeigt, wie man mit einem kostenlosen Web Scraper die URL für jedes Bild auf einer Webseite extrahiert.
Wir zeigen Ihnen auch, wie Sie diese extrahierte Liste verwenden können, um alle Bilder schnell auf Ihren Computer herunterzuladen.
Fühlen Sie sich frei, auf einen der Links zu klicken, um zu einem bestimmten Teil der Anleitung zu springen
ParseHub und Web Scraping
Um diese einfache Aufgabe zu erfüllen, benötigen Sie einen Web Scraper, der die fraglichen URLs sammeln kann. ParseHub ist ein kostenloser und unglaublich leistungsfähiger Web Scraper, der perfekte Kandidat für diese Aufgabe.
Stellen Sie sicher, dass Sie ParseHub herunterladen und installieren, bevor Sie beginnen.
Scraping von Bild-URLs
Für dieses Beispiel nehmen wir an, dass wir daran interessiert sind, jedes Bild für die ersten 5 Seiten der Ergebnisse auf Amazon.ca für „kabellose Ohrstöpsel“ herunterzuladen. Diese Informationen könnten für die Analyse von Mitbewerbern unglaublich wertvoll sein.
Einstieg
- Nach dem Herunterladen von ParseHub stellen Sie sicher, dass es auf Ihrem Computer läuft.
- Erstellen Sie die spezifische URL der Seite, die wir auslesen werden.
Erstellen eines Projekts
- Klicken Sie in ParseHub auf „Neues Projekt“ und geben Sie die URL der Amazon-Website ein, die wir auslesen werden.
- Die Webseite wird nun in ParseHub gerendert und Sie können die Bilder auswählen, die Sie scrapen möchten.
Bilder zum Scrapen auswählen
- Beginnen Sie, indem Sie das erste Bild aus den Suchergebnissen auswählen. Es wird dann grün, was bedeutet, dass es zum Scrapen ausgewählt wurde.
- Die restlichen Bilder auf der Suchergebnisseite werden dann gelb. Klicken Sie auf das zweite Bild, um alle Bilder auf der Seite auszuwählen. Sie werden alle grün, was bedeutet, dass sie für die Extraktion ausgewählt wurden.
- Da diese Bilder auch als Links zu den Produktseiten dienen, extrahiert ParseHub sowohl die Bild-URL als auch den Link, auf den sie verweist (Produktseite). Daher löschen wir die URL-Auswahl aus der linken Seitenleiste und behalten nur die Bildauswahl.
- Nun wird ParseHub jede Bild-URL für die erste Ergebnisseite scrapen.
Pagination
Jetzt müssen wir ParseHub anweisen, dieselben Informationen zu extrahieren, aber für die nächsten 5 Seiten der Suchergebnisse.
- Klicken Sie auf das PLUS(+)-Zeichen neben der Seitenauswahl und verwenden Sie den Befehl select.
- Dann klicken Sie auf die Schaltfläche „Weiter“ und das Ende der Suchergebnisseite.
- Standardmäßig extrahiert ParseHub den Link aus der Schaltfläche Weiter. Wir klicken also auf das Symbol neben der Auswahl „Weiter“ und entfernen die beiden Elemente darunter.
- Wir verwenden dann das PLUS(+)-Zeichen neben der „Weiter“-Auswahl und verwenden den Befehl „Klicken“.
- Es erscheint ein Fenster mit der Frage, ob dies ein Link zur nächsten Seite ist. Klicken Sie auf „Ja“ und geben Sie ein, wie oft dieser Zyklus wiederholt werden soll. In diesem Beispiel werden wir dies 5 Mal tun.
Daten abrufen und exportieren
Jetzt kommt der spaßige Teil, wir lassen ParseHub laufen und extrahieren die Liste der URLs für jedes Bild, das wir ausgewählt haben.
- Klicken Sie auf die Schaltfläche „Daten abrufen“ in der linken Seitenleiste.
- Hier können Sie auswählen, wann Ihr Scrape laufen soll. Obwohl wir immer dazu raten, Ihre Scrape-Durchläufe zu testen, bevor Sie einen vollständigen Scrape durchführen, führen wir den Scrape in diesem Beispiel einfach jetzt aus.
- Nun wird ParseHub die von Ihnen ausgewählten Bild-URLs scrapen. Sie können entweder auf diesem Bildschirm warten oder ParseHub verlassen. Sie werden benachrichtigt, sobald das Scrapen abgeschlossen ist. Dieser Vorgang dauerte in diesem Fall weniger als 1 Minute.
- Wenn Ihre Daten zum Download bereit sind, klicken Sie auf die Schaltfläche CSV/Excel. Nun können Sie Ihre Datei speichern und umbenennen.
Bilder auf Ihr Gerät herunterladen
Nun, da wir eine Liste aller URLs für jedes Bild haben, werden wir weitermachen und sie mit einem einfachen Tool auf unser Gerät herunterladen.
Dafür werden wir die Chrome-Erweiterung Tab Save verwenden.
Nach der Installation in Ihrem Browser öffnen Sie die Erweiterung, indem Sie auf ihr Symbol klicken. Klicken Sie dann auf die Schaltfläche „Bearbeiten“ unten links, um die URLs einzugeben, die wir gerade extrahiert haben.
Wenn Sie auf das Download-Symbol unten rechts im Fenster der Erweiterung klicken, werden alle Bilder automatisch auf Ihr Gerät heruntergeladen. Dies kann einige Sekunden dauern, je nachdem, wie viele Bilder Sie herunterladen.
Abschließende Überlegungen
Wenn Sie alle Schritte in dieser Anleitung befolgt haben, werden Sie am Ende einen Ordner mit allen Bildern haben, die Sie herunterladen mussten. In diesem Fall haben wir über 330 Bilder von Amazon in weniger als 5 Minuten heruntergeladen.
Wenn Sie mich jetzt entschuldigen würden, ich muss all diese Bilder von meiner Festplatte löschen.
Laden Sie ParseHub noch heute kostenlos herunter
Sie sind vielleicht auch an anderen Anleitungen interessiert:
- Wie man ein Datenextraktionstool zum Scrapen von AutoTrader verwendet
- Scraping von Rakuten-Daten
- Wie man Amazon-Produktdaten scrappt: Namen, Preise, ASIN, etc