How to Scrape and Download Images from any Website

Das Herunterladen vieler Bilder von einer Website kann ziemlich zeitaufwendig sein.

Rechtsklick, Bild speichern unter…, Wiederholung bis zum Gehtnichtmehr.

In diesen Fällen ist Web Scraping die Lösung für Ihr Problem. In diesem Tutorial wird gezeigt, wie man mit einem kostenlosen Web Scraper die URL für jedes Bild auf einer Webseite extrahiert.

Wir zeigen Ihnen auch, wie Sie diese extrahierte Liste verwenden können, um alle Bilder schnell auf Ihren Computer herunterzuladen.

Fühlen Sie sich frei, auf einen der Links zu klicken, um zu einem bestimmten Teil der Anleitung zu springen

ParseHub und Web Scraping

Um diese einfache Aufgabe zu erfüllen, benötigen Sie einen Web Scraper, der die fraglichen URLs sammeln kann. ParseHub ist ein kostenloser und unglaublich leistungsfähiger Web Scraper, der perfekte Kandidat für diese Aufgabe.

Stellen Sie sicher, dass Sie ParseHub herunterladen und installieren, bevor Sie beginnen.

Scraping von Bild-URLs

Für dieses Beispiel nehmen wir an, dass wir daran interessiert sind, jedes Bild für die ersten 5 Seiten der Ergebnisse auf Amazon.ca für „kabellose Ohrstöpsel“ herunterzuladen. Diese Informationen könnten für die Analyse von Mitbewerbern unglaublich wertvoll sein.

Einstieg

  1. Nach dem Herunterladen von ParseHub stellen Sie sicher, dass es auf Ihrem Computer läuft.
  2. Erstellen Sie die spezifische URL der Seite, die wir auslesen werden.

Erstellen eines Projekts

  1. Klicken Sie in ParseHub auf „Neues Projekt“ und geben Sie die URL der Amazon-Website ein, die wir auslesen werden.
  2. Die Webseite wird nun in ParseHub gerendert und Sie können die Bilder auswählen, die Sie scrapen möchten.
ParseHub zum Scrapen und Herunterladen von Bildern auf einer beliebigen Website verwenden, z.B. amazon
ParseHub zum Scrapen und Herunterladen von Bildern auf einer beliebigen Website verwenden, z.B. amazon

Bilder zum Scrapen auswählen

  1. Beginnen Sie, indem Sie das erste Bild aus den Suchergebnissen auswählen. Es wird dann grün, was bedeutet, dass es zum Scrapen ausgewählt wurde.
Web-Scraping-Bilder
Web-Scraping-Bilder: Kopfhörer werden gescraped
  1. Die restlichen Bilder auf der Suchergebnisseite werden dann gelb. Klicken Sie auf das zweite Bild, um alle Bilder auf der Seite auszuwählen. Sie werden alle grün, was bedeutet, dass sie für die Extraktion ausgewählt wurden.
Alle Bilder, die extrahiert werden sollen, sind ausgewählt
Alle Bilder, die extrahiert werden sollen, sind ausgewählt.
  1. Da diese Bilder auch als Links zu den Produktseiten dienen, extrahiert ParseHub sowohl die Bild-URL als auch den Link, auf den sie verweist (Produktseite). Daher löschen wir die URL-Auswahl aus der linken Seitenleiste und behalten nur die Bildauswahl.

Extrahierte URL-Auswahl löschen
  1. Nun wird ParseHub jede Bild-URL für die erste Ergebnisseite scrapen.

Pagination

Jetzt müssen wir ParseHub anweisen, dieselben Informationen zu extrahieren, aber für die nächsten 5 Seiten der Suchergebnisse.

  1. Klicken Sie auf das PLUS(+)-Zeichen neben der Seitenauswahl und verwenden Sie den Befehl select.
Klicken Sie auf die Funktion select und wählen Sie die nächste Schaltfläche
Klicken Sie auf die Funktion select und wählen Sie die nächste Schaltfläche.
  1. Dann klicken Sie auf die Schaltfläche „Weiter“ und das Ende der Suchergebnisseite.
  2. Standardmäßig extrahiert ParseHub den Link aus der Schaltfläche Weiter. Wir klicken also auf das Symbol neben der Auswahl „Weiter“ und entfernen die beiden Elemente darunter.
Klicken Sie hier, um beide Befehle zu erweitern und zu löschen
Klicken Sie hier, um beide Auswahlen zu erweitern und zu löschen
Url-Link aus der Schaltfläche
Url-Link aus der Schaltfläche „Weiter“ löschen
  1. Wir verwenden dann das PLUS(+)-Zeichen neben der „Weiter“-Auswahl und verwenden den Befehl „Klicken“.
  2. Es erscheint ein Fenster mit der Frage, ob dies ein Link zur nächsten Seite ist. Klicken Sie auf „Ja“ und geben Sie ein, wie oft dieser Zyklus wiederholt werden soll. In diesem Beispiel werden wir dies 5 Mal tun.
Klicken Sie auf
Klicken Sie auf „Ja“, wenn Sie gefragt werden, ob dies eine Schaltfläche für die nächste Seite ist, um die Paginierung zu behandeln.

Daten abrufen und exportieren

Jetzt kommt der spaßige Teil, wir lassen ParseHub laufen und extrahieren die Liste der URLs für jedes Bild, das wir ausgewählt haben.

  1. Klicken Sie auf die Schaltfläche „Daten abrufen“ in der linken Seitenleiste.
  2. Hier können Sie auswählen, wann Ihr Scrape laufen soll. Obwohl wir immer dazu raten, Ihre Scrape-Durchläufe zu testen, bevor Sie einen vollständigen Scrape durchführen, führen wir den Scrape in diesem Beispiel einfach jetzt aus.
Test, Run, Schedule options
  1. Nun wird ParseHub die von Ihnen ausgewählten Bild-URLs scrapen. Sie können entweder auf diesem Bildschirm warten oder ParseHub verlassen. Sie werden benachrichtigt, sobald das Scrapen abgeschlossen ist. Dieser Vorgang dauerte in diesem Fall weniger als 1 Minute.
  2. Wenn Ihre Daten zum Download bereit sind, klicken Sie auf die Schaltfläche CSV/Excel. Nun können Sie Ihre Datei speichern und umbenennen.

Bilder auf Ihr Gerät herunterladen

Nun, da wir eine Liste aller URLs für jedes Bild haben, werden wir weitermachen und sie mit einem einfachen Tool auf unser Gerät herunterladen.

Dafür werden wir die Chrome-Erweiterung Tab Save verwenden.

Nach der Installation in Ihrem Browser öffnen Sie die Erweiterung, indem Sie auf ihr Symbol klicken. Klicken Sie dann auf die Schaltfläche „Bearbeiten“ unten links, um die URLs einzugeben, die wir gerade extrahiert haben.

Wenn Sie auf das Download-Symbol unten rechts im Fenster der Erweiterung klicken, werden alle Bilder automatisch auf Ihr Gerät heruntergeladen. Dies kann einige Sekunden dauern, je nachdem, wie viele Bilder Sie herunterladen.

Den Download-Button drücken

Abschließende Überlegungen

Wenn Sie alle Schritte in dieser Anleitung befolgt haben, werden Sie am Ende einen Ordner mit allen Bildern haben, die Sie herunterladen mussten. In diesem Fall haben wir über 330 Bilder von Amazon in weniger als 5 Minuten heruntergeladen.

Desktop aller gescrapten Bilder

Wenn Sie mich jetzt entschuldigen würden, ich muss all diese Bilder von meiner Festplatte löschen.

Laden Sie ParseHub noch heute kostenlos herunter

Sie sind vielleicht auch an anderen Anleitungen interessiert:

  • Wie man ein Datenextraktionstool zum Scrapen von AutoTrader verwendet
  • Scraping von Rakuten-Daten
  • Wie man Amazon-Produktdaten scrappt: Namen, Preise, ASIN, etc

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.