Come raschiare e scaricare immagini da qualsiasi sito web

Scaricare molte immagini da un sito web può richiedere molto tempo.

Clicca col tasto destro, Salva immagine con nome…, ripeti ad nauseam.

In questi casi, il web scraping è la soluzione al tuo problema. In questo tutorial, vedremo come estrarre l’URL di ogni immagine su una pagina web usando un web scraper gratuito.

Vedremo anche come usare questa lista estratta per scaricare rapidamente tutte le immagini sul tuo computer.

Sentitevi liberi di cliccare su qualsiasi link per saltare ad una certa parte della guida

ParseHub e Web Scraping

Per completare questo semplice compito, avrete bisogno di un web scraper che possa raccogliere gli URL in questione. ParseHub è un web scraper gratuito e incredibilmente potente, il candidato perfetto per questo compito.

Assicurati di scaricare e installare ParseHub prima di iniziare.

Scraping di URL di immagini

Per questo esempio, assumeremo che siamo interessati a scaricare ogni immagine delle prime 5 pagine di risultati su Amazon.ca per “auricolari wireless”. Questa informazione potrebbe potenzialmente essere incredibilmente preziosa per l’analisi dei concorrenti.

Inizio

  1. Dopo aver scaricato ParseHub, assicurati di averlo attivo e funzionante sul tuo computer.
  2. Prendi l’URL specifico della pagina che dovremo raschiare.

Creazione di un progetto

  1. In ParseHub, clicca su “New Project” e inserisci l’URL del sito Amazon che dovremo raschiare.
  2. La pagina web sarà ora resa in ParseHub e sarai in grado di scegliere le immagini che vuoi raschiare.
Using ParseHub to scrape and download images on any site, using amazon for example
Using ParseHub to scrape and download images on any site, using amazon for example

Select Images to Scrape

  1. Begin selezionando la prima immagine dai risultati della ricerca. Diventerà verde, il che significa che è stata selezionata per essere raschiata.
web scraping images
web scraping images: earphones are getting scraped
  1. Il resto delle immagini nella pagina dei risultati della ricerca diventerà giallo. Clicca sulla seconda immagine per selezionare tutte le immagini nella pagina. Diventeranno tutte verdi, il che significa che sono state selezionate per essere estratte.
Tutte le immagini che stanno per essere estratte sono selezionate
Tutte le immagini che stanno per essere estratte sono selezionate.
  1. Siccome queste immagini fungono anche da link alle pagine dei prodotti, ParseHub sta estraendo sia l’URL dell’immagine che il link a cui punta (pagina del prodotto). Di conseguenza, elimineremo la selezione dell’URL dalla barra laterale sinistra e manterremo solo la selezione dell’immagine.
elimina le selezioni di url estratte
  1. Ora ParseHub raschierà ogni URL di immagine per la prima pagina di risultati.

Paginazione

Ora dobbiamo dire a ParseHub di estrarre queste stesse informazioni ma per le prossime 5 pagine di risultati di ricerca.

  1. Clicca sul segno PLUS(+) accanto alla selezione della pagina e usa il comando select.
Clicca sulla funzione select e scegli il pulsante next
clicca sulla funzione select e scegli il pulsante next.
  1. Poi clicchiamo sul pulsante “Next” e in fondo alla pagina dei risultati della ricerca.
  2. Per default, ParseHub estrarrà il link dal pulsante Next. Quindi clicchiamo sull’icona accanto alla selezione “Avanti” e rimuoviamo i due elementi sotto di essa.
Clicca qui per espandere ed eliminare entrambi i comandi
Clicca qui per espandere ed eliminare entrambe le selezioni
Elimina l'URL dal pulsante successivo
elimina il link url dal pulsante successivo
  1. Poi useremo il segno PIÙ(+) accanto alla selezione “successivo” e useremo il comando “click”.
  2. Apparirà una finestra che chiederà se questo è un link alla pagina successiva. Clicca su “Sì” e inserisci il numero di volte che vuoi che questo ciclo si ripeta. Per questo esempio, lo faremo 5 volte.
Clicca sì per gestire la paginazione
Clicca sì quando viene chiesto se questo è un pulsante di pagina successiva per gestire la paginazione.

Scrape ed esportazione dei dati

Ora arriva la parte divertente, lasceremo ParseHub eseguire ed estrarre la lista di URL per ogni immagine che abbiamo selezionato.

  1. Clicca sul pulsante “Get Data” sulla barra laterale sinistra.
  2. Qui puoi selezionare quando eseguire lo scrape. Anche se consigliamo sempre di testare l’esecuzione del tuo scrape prima di eseguire un scrape completo, per questo esempio eseguiremo solo lo scrape adesso.
Test, Run, Schedule options
  1. Ora ParseHub eseguirà lo scrape degli URL delle immagini che hai selezionato. Puoi aspettare in questa schermata o lasciare ParseHub, sarai avvisato una volta che lo scrape è completato. Questo processo ha richiesto meno di 1 minuto in questo caso.
  2. Una volta che i tuoi dati sono pronti per il download, clicca sul pulsante CSV/Excel. Ora puoi salvare e rinominare il tuo file.

Scaricate le immagini sul vostro dispositivo

Ora che abbiamo una lista di tutti gli URL per ogni immagine, andremo avanti e le scaricheremo sul nostro dispositivo con un semplice strumento.

Per questo, useremo l’estensione Tab Save chrome.

Una volta installata sul vostro browser, aprite l’estensione cliccando sulla sua icona. Questo aprirà l’estensione, quindi cliccate sul pulsante di modifica in basso a sinistra per inserire gli URL che abbiamo appena estratto.

Quando cliccate sull’icona di download in basso a destra della finestra dell’estensione, tutte le immagini saranno automaticamente scaricate sul vostro dispositivo. Questo potrebbe richiedere un paio di secondi a seconda di quante immagini stai scaricando.

Premendo il pulsante di download

Pensieri finali

Seguendo ogni passo di questa guida, ti ritroverai con una cartella con tutte le immagini che dovevi scaricare. In questo caso, abbiamo scaricato oltre 330 immagini da Amazon in meno di 5 minuti.

desktop di tutte le immagini raschiate

Ora, se volete scusarmi, devo andare a cancellare tutte queste immagini dal mio disco rigido.

Scarica ParseHub gratuitamente oggi

Potresti anche essere interessato a leggere altre guide:

  • Come usare uno strumento di estrazione dati per raschiare AutoTrader
  • Scrappare i dati di Rakuten
  • Come raschiare i dati dei prodotti Amazon: Nomi, prezzi, ASIN, ecc

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.