How to Scrape and Download Images from any Website

Het downloaden van veel afbeeldingen van een website kan behoorlijk tijdrovend zijn.

Right-click, Save Image As…, repeat ad nauseam.

In deze gevallen, web scraping is de oplossing voor uw probleem. In deze tutorial gaan we over hoe je de URL voor elke afbeelding op een webpagina met behulp van een gratis web scraper.

We zullen ook gaan over hoe deze uitgepakte lijst te gebruiken om snel alle afbeeldingen te downloaden naar uw computer.

Voel je vrij om op een van de links te klikken om naar een bepaald deel van de how to gids te springen

ParseHub en Web Scraping

Om deze eenvoudige taak te voltooien, hebt u een web scraper nodig die de URL’s in kwestie kan verzamelen. ParseHub is een gratis en ongelooflijk krachtige web scraper, de perfecte kandidaat voor deze taak.

Zorg ervoor dat u ParseHub downloadt en installeert voordat u aan de slag gaat.

Scraping Image URLs

Voor dit voorbeeld gaan we ervan uit dat we geïnteresseerd zijn in het downloaden van elke afbeelding voor de eerste 5 pagina’s van de resultaten op Amazon.ca voor “draadloze oordopjes”. Deze informatie kan potentieel ongelooflijk waardevol zijn voor de analyse van concurrenten.

Getting Started

  1. Na het downloaden van ParseHub, zorg ervoor dat je het hebt en draait op uw computer.
  2. Neem de specifieke URL van de pagina die we gaan schrapen.

Een project maken

  1. In ParseHub, klik op “Nieuw Project” en voer de URL in van de Amazon website die we gaan schrapen.
  2. De webpagina wordt nu weergegeven in ParseHub en u kunt de afbeeldingen kiezen die u wilt scrapen.
Het gebruik van ParseHub voor het scrapen en downloaden van afbeeldingen op elke site, met amazon als voorbeeld
Het gebruik van ParseHub voor het scrapen en downloaden van afbeeldingen op elke site, met amazon als voorbeeld

Selecteer afbeeldingen om te scrapen

  1. Begin met het selecteren van de eerste afbeelding uit de zoekresultaten. De afbeelding wordt groen, wat betekent dat deze is geselecteerd om te worden geschraapt.
web scraping afbeeldingen
web scraping afbeeldingen: oortelefoons worden geschraapt
  1. De rest van de afbeeldingen op de pagina met zoekresultaten wordt vervolgens geel. Klik op de tweede afbeelding om alle afbeeldingen op de pagina te selecteren. Ze worden allemaal groen, wat betekent dat ze zijn geselecteerd om te worden geëxtraheerd.
Alle afbeeldingen die worden geschraapt, zijn geselecteerd
alle afbeeldingen die zullen worden geschraapt, zijn geselecteerd.
  1. Omdat deze afbeeldingen ook fungeren als koppelingen naar de productpagina’s, extraheert ParseHub zowel de URL van de afbeelding als de koppeling waarnaar deze verwijst (productpagina). Daarom verwijderen we de URL-selectie uit de linkerzijbalk en behouden we alleen de afbeeldingsselectie.

verwijderde geëxtraheerde url-selecties
  1. Nu zal ParseHub elke afbeeldings-URL voor de eerste pagina met resultaten schrapen.

Paginatie

Nu moeten we ParseHub vertellen om deze zelfde informatie te extraheren, maar dan voor de volgende 5 pagina’s met zoekresultaten.

  1. Klik op het PLUS(+)-teken naast de paginaselectie en gebruik de select-opdracht.
Klik op de select-functie en kies de volgende knop
Klik op de select-functie en kies de volgende knop.
  1. Klik vervolgens op de knop “Volgende” en de onderkant van de pagina met zoekresultaten.
  2. Zo haalt ParseHub standaard de link uit de knop Volgende. Dus zullen we klikken op het pictogram naast de “Volgende” selectie en de twee items eronder verwijderen.
Klik hier om beide opdrachten uit te vouwen en te verwijderen
Klik hier om beide selecties uit te vouwen en te verwijderen
Verwijder URL van de volgende knop
verwijder url-link van de volgende knop
  1. We zullen dan het PLUS(+)-teken naast de “volgende” selectie gebruiken en het “klik”-commando gebruiken.
  2. Er verschijnt een venster met de vraag of dit een link naar de volgende pagina is. Klik op “Ja” en voer het aantal keren in dat u deze cyclus wilt laten herhalen. In dit voorbeeld doen we dat 5 keer.
Klik op
Klik op “Ja” als u wordt gevraagd of dit een knop voor de volgende pagina is om de paginering te verwerken.

Gegevens scrapen en exporteren

Nu komt het leukste gedeelte, we gaan ParseHub de lijst met URL’s laten uitvoeren en extraheren voor elke afbeelding die we hebben geselecteerd.

  1. Klik op de knop “Gegevens ophalen” in de linkerzijbalk.
  2. Hier kunt u selecteren wanneer u uw scrape wilt uitvoeren. Hoewel we altijd adviseren om de scraperuns te testen voordat u een volledige scrape uitvoert, voeren we de scrape nu alleen uit voor dit voorbeeld.
Test, uitvoeren, opties plannen
  1. Nu gaat ParseHub de afbeeldings-URL’s scrapen die u hebt geselecteerd. U kunt op dit scherm wachten of ParseHub verlaten, u krijgt bericht zodra de scrape is voltooid. Dit proces duurde in dit geval minder dan 1 minuut.
  2. Als uw gegevens klaar zijn om te downloaden, klikt u op de CSV/Excel knop. Nu kunt u uw bestand opslaan en hernoemen.

Afbeeldingen downloaden naar uw apparaat

Nu we een lijst met alle URL’s voor elke afbeelding hebben, gaan we verder en downloaden ze naar ons apparaat met een eenvoudige tool.

Voor dit, zullen we gebruik maken van de Tab Save chroom extensie.

Eenmaal geïnstalleerd op uw browser, opent u de extensie door te klikken op het pictogram. Dit zal de extensie openen, klik vervolgens op de knop bewerken linksonder om de URL’s in te voeren die we zojuist hebben geëxtraheerd.

Wanneer u op het download-pictogram rechtsonder in het venster van de extensie klikt, worden alle afbeeldingen automatisch naar uw apparaat gedownload. Dit kan enkele seconden duren, afhankelijk van het aantal afbeeldingen dat u downloadt.

Drukken op de downloadknop

Eindgedachten

Als u elke stap in deze handleiding volgt, krijgt u een map met alle afbeeldingen die u moest downloaden. In dit geval hebben we meer dan 330 afbeeldingen van Amazon gedownload in minder dan 5 minuten.

desktop van alle geschraapte afbeeldingen

Nu, als u me wilt excuseren, ik moet al deze afbeeldingen van mijn harde schijf gaan verwijderen.

Download ParseHub vandaag gratis

U bent misschien ook geïnteresseerd in andere handleidingen:

  • Hoe gebruik je een data-extractie-tool om AutoTrader te scrapen
  • Scraping Rakuten Data
  • Hoe scraap je Amazon Product Data: Namen, prijzen, ASIN, enz

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.