Kuvien kaapiminen ja lataaminen miltä tahansa verkkosivulta

Kuvien lataaminen verkkosivuilta voi olla melko aikaa vievää.

Klikkaa hiiren oikealla painikkeella, Tallenna kuva nimellä…, toista loputtomiin.

Tällaisissa tapauksissa web-skrappaus on ratkaisu ongelmaan. Tässä opetusohjelmassa käymme läpi, miten voimme poimia jokaisen verkkosivulla olevan kuvan URL-osoitteen ilmaisella verkkokaapimella.

Käymme myös läpi, miten voimme käyttää tätä poimittua luetteloa kaikkien kuvien nopeaan lataamiseen tietokoneellesi.

Klikkaa vapaasti mitä tahansa linkkiä hypätäksesi tiettyyn osaan how to -oppaasta

ParseHub ja Web Scraping

Tämän yksinkertaisen tehtävän suorittamiseksi tarvitset web scraperin, joka voi kerätä kyseiset URL-osoitteet. ParseHub on ilmainen ja uskomattoman tehokas web-skrapperi, joka on täydellinen ehdokas tähän tehtävään.

Varmista, että olet ladannut ja asentanut ParseHubin ennen kuin aloitat.

Kuva-URL:ien skrappaus

Tässä esimerkissä oletamme, että olemme kiinnostuneita lataamaan Amazon.ca-sivuston hakusanalla ”langattomat kuulokkeet” löytyvän tuloksen 5 ensimmäisen sivun jokaisen kuvan. Nämä tiedot voivat mahdollisesti olla uskomattoman arvokkaita kilpailija-analyysin kannalta.

Aloittaminen

  1. Kun olet ladannut ParseHubin, varmista, että se on käynnissä tietokoneellasi.
  2. Hakeudu tarkkaan sen sivun URL-osoitteeseen, jonka aiomme kaavata.

Projektin luominen

  1. Klikkaa ParseHubissa ”New Project” (Uusi projekti) ja syötä Amazonin verkkosivuston URL-osoite, jonka aiomme kaavata.
  2. Websivu renderöityy nyt ParseHubissa ja voit valita kuvat, jotka haluat kaavata.
ParseHubin käyttäminen kuvien kaapimiseen ja lataamiseen miltä tahansa sivustolta, esimerkkinä amazon
ParseHubin käyttäminen kuvien kaapimiseen ja lataamiseen miltä tahansa sivustolta, esimerkkinä amazon

Kuvien valitseminen kaapattavaksi

  1. Aloita valitsemalla ensimmäinen kuva hakutuloksista. Sen jälkeen se muuttuu vihreäksi, mikä tarkoittaa, että se on valittu raapattavaksi.
web scraping images
web scraping images: earphones are getting scraped
  1. Loppuosa hakutulossivun kuvista muuttuu sitten keltaiseksi. Valitse kaikki sivun kuvat napsauttamalla toista kuvaa. Ne muuttuvat kaikki vihreiksi, mikä tarkoittaa, että ne on valittu poimittaviksi.
All imgaes that are getting scraped are selcted
all images that are going to get scraped are selected.
  1. Koska nämä kuvat toimivat myös linkkeinä tuotesivuille, ParseHub poimii sekä kuvan URL-osoitteen että linkin, johon se osoittaa (tuotesivu). Tämän seurauksena poistamme URL-valinnan vasemmasta sivupalkista ja säilytämme vain kuvavalinnan.
poistetaan poimitut url-valinnat
  1. Nyt ParseHub kaapii jokaisen kuvan URL-osoitteen ensimmäiseltä tulosivulta.

Sivujen poiminta

Nyt meidän on käskettävä ParseHubia poimimaan nämä samat tiedot, mutta hakutulosten seuraaville viidelle sivulle.

  1. Klikkaa sivun valinnan vieressä olevaa PLUS(+)-merkkiä ja käytä select-komentoa.
Klikkaa select-toimintoa ja valitse seuraava-painike
klikkaa select-toimintoa ja valitse seuraava-painike.
  1. Klikkaa sitten Seuraava-painiketta ja hakutulossivun alareunaa.
  2. Oletusarvoisesti ParseHub poimii linkin Seuraava-painikkeesta. Klikkaamme siis ”Seuraava”-valinnan vieressä olevaa kuvaketta ja poistamme sen alla olevat kaksi kohdetta.
Klikkaa tästä laajentaaksesi ja poistaaksesi molemmat komennot
Klikkaa tästä laajentaaksesi ja poistaaksesi molemmat valinnat
Poista URL-osoite seuraavasta painikkeesta
poista url-linkki seuraavasta painikkeesta
  1. Käytämme sen jälkeen ”Seuraava”-valinnan viereistä PLUS(+)-merkkiä ja napsautamme sitä.
  2. Ikkuna avautuu ja kysyy, onko kyseessä Seuraava sivu -linkki. Klikkaa ”Kyllä” ja syötä kuinka monta kertaa haluat tämän syklin toistuvan. Tässä esimerkissä teemme sen 5 kertaa.
Klikkaa kyllä käsitelläksesi sivunumerointia
Klikkaa kyllä, kun kysytään, onko tämä Seuraava sivu -painike käsitelläksesi sivunumerointia.

Kaavi ja vie tiedot

Nyt tulee hauska osa, annamme ParseHubin ajaa ja poimia luettelon URL-osoitteista jokaisesta valitsemastamme kuvasta.

  1. Klikkaa vasemmanpuoleisessa sivupalkissa olevaa ”Get Data” -painiketta.
  2. Tässä voit valita, milloin haluat ajaa kaapin. Vaikka suosittelemme aina testaamaan skrappausajot ennen täydellisen skrappauksen suorittamista, suoritamme skrappauksen juuri nyt tätä esimerkkiä varten.
Testaus, Suorita, Aikataulutusasetukset
  1. Nyt ParseHub skrappaa valitsemasi kuva-URL:t. Voit joko odottaa tässä näytössä tai poistua ParseHubista, sinulle ilmoitetaan, kun skrappaus on valmis. Tämä prosessi kesti tässä tapauksessa alle 1 minuutin.
  2. Kun tiedot ovat valmiina ladattavaksi, napsauta CSV/Excel-painiketta. Nyt voit tallentaa ja nimetä tiedostosi uudelleen.

Kuvien lataaminen laitteeseen

Nyt kun meillä on luettelo kaikkien kuvien URL-osoitteista, siirrymme eteenpäin ja lataamme ne laitteeseemme yhdellä yksinkertaisella työkalulla.

Tässä käytämme Tab Save Chrome -laajennusta.

Asennettuasi selaimellesi avaa laajennus napsauttamalla sen kuvaketta. Tämä avaa laajennuksen, ja napsauta sitten vasemmassa alareunassa olevaa muokkauspainiketta syöttääksesi juuri poimimamme URL-osoitteet.

Kun napsautat laajennuksen ikkunoiden oikeassa alareunassa olevaa latauskuvaketta, kaikki kuvat ladataan automaattisesti laitteellesi. Tämä saattaa kestää muutaman sekunnin riippuen siitä, kuinka monta kuvaa lataat.

Latauspainikkeen painaminen

Loppuajatuksia

Jos olet noudattanut tämän oppaan jokaista vaihetta, sinulla on lopulta kansio, jossa on kaikki kuvat, jotka halusit ladata. Tässä tapauksessa latasimme Amazonista yli 330 kuvaa alle viidessä minuutissa.

kaavittujen kuvien kansio

Nyt, jos suotte anteeksi, minun on mentävä poistamaan kaikki nämä kuvat kovalevyltäni.

Lataa ParseHub ilmaiseksi jo tänään

Olet ehkä kiinnostunut lukemaan myös muita ohjeita:

  • How to use a data extraction tool to scrape AutoTrader
  • Scraping Rakuten Data
  • How to Scrape Amazon Product Data: Nimet, hinnoittelu, ASIN jne

Vastaa

Sähköpostiosoitettasi ei julkaista.