Het downloaden van veel afbeeldingen van een website kan behoorlijk tijdrovend zijn.
Right-click, Save Image As…, repeat ad nauseam.
In deze gevallen, web scraping is de oplossing voor uw probleem. In deze tutorial gaan we over hoe je de URL voor elke afbeelding op een webpagina met behulp van een gratis web scraper.
We zullen ook gaan over hoe deze uitgepakte lijst te gebruiken om snel alle afbeeldingen te downloaden naar uw computer.
Voel je vrij om op een van de links te klikken om naar een bepaald deel van de how to gids te springen
ParseHub en Web Scraping
Om deze eenvoudige taak te voltooien, hebt u een web scraper nodig die de URL’s in kwestie kan verzamelen. ParseHub is een gratis en ongelooflijk krachtige web scraper, de perfecte kandidaat voor deze taak.
Zorg ervoor dat u ParseHub downloadt en installeert voordat u aan de slag gaat.
Scraping Image URLs
Voor dit voorbeeld gaan we ervan uit dat we geïnteresseerd zijn in het downloaden van elke afbeelding voor de eerste 5 pagina’s van de resultaten op Amazon.ca voor “draadloze oordopjes”. Deze informatie kan potentieel ongelooflijk waardevol zijn voor de analyse van concurrenten.
Getting Started
- Na het downloaden van ParseHub, zorg ervoor dat je het hebt en draait op uw computer.
- Neem de specifieke URL van de pagina die we gaan schrapen.
Een project maken
- In ParseHub, klik op “Nieuw Project” en voer de URL in van de Amazon website die we gaan schrapen.
- De webpagina wordt nu weergegeven in ParseHub en u kunt de afbeeldingen kiezen die u wilt scrapen.
Selecteer afbeeldingen om te scrapen
- Begin met het selecteren van de eerste afbeelding uit de zoekresultaten. De afbeelding wordt groen, wat betekent dat deze is geselecteerd om te worden geschraapt.
- De rest van de afbeeldingen op de pagina met zoekresultaten wordt vervolgens geel. Klik op de tweede afbeelding om alle afbeeldingen op de pagina te selecteren. Ze worden allemaal groen, wat betekent dat ze zijn geselecteerd om te worden geëxtraheerd.
- Omdat deze afbeeldingen ook fungeren als koppelingen naar de productpagina’s, extraheert ParseHub zowel de URL van de afbeelding als de koppeling waarnaar deze verwijst (productpagina). Daarom verwijderen we de URL-selectie uit de linkerzijbalk en behouden we alleen de afbeeldingsselectie.
- Nu zal ParseHub elke afbeeldings-URL voor de eerste pagina met resultaten schrapen.
Paginatie
Nu moeten we ParseHub vertellen om deze zelfde informatie te extraheren, maar dan voor de volgende 5 pagina’s met zoekresultaten.
- Klik op het PLUS(+)-teken naast de paginaselectie en gebruik de select-opdracht.
- Klik vervolgens op de knop “Volgende” en de onderkant van de pagina met zoekresultaten.
- Zo haalt ParseHub standaard de link uit de knop Volgende. Dus zullen we klikken op het pictogram naast de “Volgende” selectie en de twee items eronder verwijderen.
- We zullen dan het PLUS(+)-teken naast de “volgende” selectie gebruiken en het “klik”-commando gebruiken.
- Er verschijnt een venster met de vraag of dit een link naar de volgende pagina is. Klik op “Ja” en voer het aantal keren in dat u deze cyclus wilt laten herhalen. In dit voorbeeld doen we dat 5 keer.
Gegevens scrapen en exporteren
Nu komt het leukste gedeelte, we gaan ParseHub de lijst met URL’s laten uitvoeren en extraheren voor elke afbeelding die we hebben geselecteerd.
- Klik op de knop “Gegevens ophalen” in de linkerzijbalk.
- Hier kunt u selecteren wanneer u uw scrape wilt uitvoeren. Hoewel we altijd adviseren om de scraperuns te testen voordat u een volledige scrape uitvoert, voeren we de scrape nu alleen uit voor dit voorbeeld.
- Nu gaat ParseHub de afbeeldings-URL’s scrapen die u hebt geselecteerd. U kunt op dit scherm wachten of ParseHub verlaten, u krijgt bericht zodra de scrape is voltooid. Dit proces duurde in dit geval minder dan 1 minuut.
- Als uw gegevens klaar zijn om te downloaden, klikt u op de CSV/Excel knop. Nu kunt u uw bestand opslaan en hernoemen.
Afbeeldingen downloaden naar uw apparaat
Nu we een lijst met alle URL’s voor elke afbeelding hebben, gaan we verder en downloaden ze naar ons apparaat met een eenvoudige tool.
Voor dit, zullen we gebruik maken van de Tab Save chroom extensie.
Eenmaal geïnstalleerd op uw browser, opent u de extensie door te klikken op het pictogram. Dit zal de extensie openen, klik vervolgens op de knop bewerken linksonder om de URL’s in te voeren die we zojuist hebben geëxtraheerd.
Wanneer u op het download-pictogram rechtsonder in het venster van de extensie klikt, worden alle afbeeldingen automatisch naar uw apparaat gedownload. Dit kan enkele seconden duren, afhankelijk van het aantal afbeeldingen dat u downloadt.
Eindgedachten
Als u elke stap in deze handleiding volgt, krijgt u een map met alle afbeeldingen die u moest downloaden. In dit geval hebben we meer dan 330 afbeeldingen van Amazon gedownload in minder dan 5 minuten.
Nu, als u me wilt excuseren, ik moet al deze afbeeldingen van mijn harde schijf gaan verwijderen.
Download ParseHub vandaag gratis
U bent misschien ook geïnteresseerd in andere handleidingen:
- Hoe gebruik je een data-extractie-tool om AutoTrader te scrapen
- Scraping Rakuten Data
- Hoe scraap je Amazon Product Data: Namen, prijzen, ASIN, enz