Scaricare molte immagini da un sito web può richiedere molto tempo.
Clicca col tasto destro, Salva immagine con nome…, ripeti ad nauseam.
In questi casi, il web scraping è la soluzione al tuo problema. In questo tutorial, vedremo come estrarre l’URL di ogni immagine su una pagina web usando un web scraper gratuito.
Vedremo anche come usare questa lista estratta per scaricare rapidamente tutte le immagini sul tuo computer.
Sentitevi liberi di cliccare su qualsiasi link per saltare ad una certa parte della guida
ParseHub e Web Scraping
Per completare questo semplice compito, avrete bisogno di un web scraper che possa raccogliere gli URL in questione. ParseHub è un web scraper gratuito e incredibilmente potente, il candidato perfetto per questo compito.
Assicurati di scaricare e installare ParseHub prima di iniziare.
Scraping di URL di immagini
Per questo esempio, assumeremo che siamo interessati a scaricare ogni immagine delle prime 5 pagine di risultati su Amazon.ca per “auricolari wireless”. Questa informazione potrebbe potenzialmente essere incredibilmente preziosa per l’analisi dei concorrenti.
Inizio
- Dopo aver scaricato ParseHub, assicurati di averlo attivo e funzionante sul tuo computer.
- Prendi l’URL specifico della pagina che dovremo raschiare.
Creazione di un progetto
- In ParseHub, clicca su “New Project” e inserisci l’URL del sito Amazon che dovremo raschiare.
- La pagina web sarà ora resa in ParseHub e sarai in grado di scegliere le immagini che vuoi raschiare.
Select Images to Scrape
- Begin selezionando la prima immagine dai risultati della ricerca. Diventerà verde, il che significa che è stata selezionata per essere raschiata.
- Il resto delle immagini nella pagina dei risultati della ricerca diventerà giallo. Clicca sulla seconda immagine per selezionare tutte le immagini nella pagina. Diventeranno tutte verdi, il che significa che sono state selezionate per essere estratte.
- Siccome queste immagini fungono anche da link alle pagine dei prodotti, ParseHub sta estraendo sia l’URL dell’immagine che il link a cui punta (pagina del prodotto). Di conseguenza, elimineremo la selezione dell’URL dalla barra laterale sinistra e manterremo solo la selezione dell’immagine.
- Ora ParseHub raschierà ogni URL di immagine per la prima pagina di risultati.
Paginazione
Ora dobbiamo dire a ParseHub di estrarre queste stesse informazioni ma per le prossime 5 pagine di risultati di ricerca.
- Clicca sul segno PLUS(+) accanto alla selezione della pagina e usa il comando select.
- Poi clicchiamo sul pulsante “Next” e in fondo alla pagina dei risultati della ricerca.
- Per default, ParseHub estrarrà il link dal pulsante Next. Quindi clicchiamo sull’icona accanto alla selezione “Avanti” e rimuoviamo i due elementi sotto di essa.
- Poi useremo il segno PIÙ(+) accanto alla selezione “successivo” e useremo il comando “click”.
- Apparirà una finestra che chiederà se questo è un link alla pagina successiva. Clicca su “Sì” e inserisci il numero di volte che vuoi che questo ciclo si ripeta. Per questo esempio, lo faremo 5 volte.
Scrape ed esportazione dei dati
Ora arriva la parte divertente, lasceremo ParseHub eseguire ed estrarre la lista di URL per ogni immagine che abbiamo selezionato.
- Clicca sul pulsante “Get Data” sulla barra laterale sinistra.
- Qui puoi selezionare quando eseguire lo scrape. Anche se consigliamo sempre di testare l’esecuzione del tuo scrape prima di eseguire un scrape completo, per questo esempio eseguiremo solo lo scrape adesso.
- Ora ParseHub eseguirà lo scrape degli URL delle immagini che hai selezionato. Puoi aspettare in questa schermata o lasciare ParseHub, sarai avvisato una volta che lo scrape è completato. Questo processo ha richiesto meno di 1 minuto in questo caso.
- Una volta che i tuoi dati sono pronti per il download, clicca sul pulsante CSV/Excel. Ora puoi salvare e rinominare il tuo file.
Scaricate le immagini sul vostro dispositivo
Ora che abbiamo una lista di tutti gli URL per ogni immagine, andremo avanti e le scaricheremo sul nostro dispositivo con un semplice strumento.
Per questo, useremo l’estensione Tab Save chrome.
Una volta installata sul vostro browser, aprite l’estensione cliccando sulla sua icona. Questo aprirà l’estensione, quindi cliccate sul pulsante di modifica in basso a sinistra per inserire gli URL che abbiamo appena estratto.
Quando cliccate sull’icona di download in basso a destra della finestra dell’estensione, tutte le immagini saranno automaticamente scaricate sul vostro dispositivo. Questo potrebbe richiedere un paio di secondi a seconda di quante immagini stai scaricando.
Pensieri finali
Seguendo ogni passo di questa guida, ti ritroverai con una cartella con tutte le immagini che dovevi scaricare. In questo caso, abbiamo scaricato oltre 330 immagini da Amazon in meno di 5 minuti.
Ora, se volete scusarmi, devo andare a cancellare tutte queste immagini dal mio disco rigido.
Scarica ParseHub gratuitamente oggi
Potresti anche essere interessato a leggere altre guide:
- Come usare uno strumento di estrazione dati per raschiare AutoTrader
- Scrappare i dati di Rakuten
- Come raschiare i dati dei prodotti Amazon: Nomi, prezzi, ASIN, ecc