Jak skrobać i pobierać obrazy z dowolnej strony internetowej | ParseHub

Pobieranie dużej ilości obrazów ze strony internetowej może być dość czasochłonne.

Kliknij prawym przyciskiem myszy, Zapisz obraz jako…, powtarzaj ad nauseam.

W tych przypadkach, skrobanie stron internetowych jest rozwiązaniem twojego problemu. W tym poradniku, przejdziemy do tego jak wyodrębnić adres URL dla każdego obrazu na stronie internetowej używając darmowego web scrapera.

Przejdziemy również do tego jak użyć tej wyodrębnionej listy aby szybko pobrać wszystkie obrazy na swój komputer.

Nie krępuj się kliknąć na którykolwiek z linków, aby przejść do określonej części przewodnika

ParseHub i Web Scraping
Scraping adresów URL obrazów
Rozpoczynanie
Tworzenie projektu
Wybieranie obrazów do skrobania
Paginacja
Skrobanie i eksport danych
Pobieranie obrazów na urządzenie
Pomysły końcowe

ParseHub i Web Scraping

Aby wykonać to proste zadanie, będziesz potrzebował web scrapera, który może zbierać adresy URL, o których mowa. ParseHub jest darmowym i niesamowicie potężnym web scraperem, idealnym kandydatem do tego zadania.

Pewnie pobierz i zainstaluj ParseHub przed rozpoczęciem pracy.

Scraping adresów URL obrazów

Dla tego przykładu, założymy, że jesteśmy zainteresowani pobraniem każdego obrazu z pierwszych 5 stron wyników na Amazon.ca dla „bezprzewodowych wkładek dousznych”. Ta informacja może być potencjalnie bardzo cenna dla analizy konkurencji.

Rozpoczynanie

Po pobraniu ParseHub, upewnij się, że masz go uruchomionego na swoim komputerze.
Wybierz konkretny adres URL strony, którą będziemy skrobać.

Tworzenie projektu

W ParseHub, kliknij na „Nowy projekt” i wprowadź adres URL strony Amazon, którą będziemy skrobać.
Strona internetowa będzie teraz renderowana w ParseHub i będziesz mógł wybrać obrazy, które chcesz zeskrobać.

Używanie ParseHub do skrobania i pobierania obrazów na dowolnej stronie, na przykładzie amazon

Wybieranie obrazów do skrobania

Zacznij od wybrania pierwszego obrazu z wyników wyszukiwania. Następnie zmieni on kolor na zielony, co oznacza, że został wybrany do zeskrobania.

web scraping images: earphones are getting scraped

Reszta obrazów na stronie wyników wyszukiwania zmieni kolor na żółty. Kliknij na drugi obrazek, aby wybrać wszystkie obrazki na stronie. Wszystkie zmienią kolor na zielony, co oznacza, że zostały wybrane do wyodrębnienia.

Wszystkie obrazy, które są wyodrębniane są zaznaczone — Wszystkie obrazy, które będą wyodrębniane są zaznaczone.

Ponieważ te obrazy działają również jako linki do stron produktów, ParseHub wyodrębnia zarówno adres URL obrazu jak i link, na który wskazuje (strona produktu). W rezultacie usuniemy selekcję URL z lewego paska bocznego i zachowamy tylko selekcję obrazów.

Teraz ParseHub będzie skrobał każdy URL obrazu dla pierwszej strony wyników.

Paginacja

Teraz musimy powiedzieć ParseHub, aby wyodrębnił te same informacje, ale dla kolejnych 5 stron wyników wyszukiwania.

Kliknij na znak PLUS(+) obok wyboru strony i użyj polecenia select.

kliknij na funkcję select i wybierz następny przycisk.

Potem klikamy na przycisk „Next” i na dole strony z wynikami wyszukiwania.
Domyślnie ParseHub wyodrębnia link z przycisku Next. Klikamy więc na ikonę obok zaznaczenia „Next” i usuwamy dwa elementy znajdujące się pod nim.

kliknij tutaj, aby rozwinąć i usunąć oba polecenia — kliknij tutaj, aby rozwinąć i usunąć oba zaznaczenia

usuń URL z następnego przycisku — usuń link url z następnego przycisku

Wtedy użyjemy znaku PLUS(+) obok zaznaczenia „Następny” i użyjemy polecenia „kliknij”.
Wystąpi okno z pytaniem, czy jest to link Następna strona. Kliknij „Tak” i wpisz liczbę powtórzeń tego cyklu. Dla tego przykładu, zrobimy to 5 razy.

Kliknij tak, aby poradzić sobie z paginacją — Kliknij tak, gdy pojawi się pytanie, czy jest to przycisk następnej strony, aby poradzić sobie z paginacją.

Skrobanie i eksport danych

Teraz nadchodzi część zabawy, pozwolimy ParseHubowi uruchomić i wyodrębnić listę adresów URL dla każdego obrazu, który wybraliśmy.

Kliknij na przycisk „Pobierz dane” na lewym pasku bocznym.
Tutaj możesz wybrać, kiedy uruchomić skrobanie. Chociaż zawsze zalecamy przetestowanie działania scrape’u przed uruchomieniem pełnego scrape’u, po prostu uruchomimy scrape teraz dla tego przykładu.

Teraz ParseHub będzie skrobał adresy URL obrazów, które wybrałeś. Możesz czekać na tym ekranie lub opuścić ParseHub, zostaniesz powiadomiony po zakończeniu skrobania. Ten proces trwał mniej niż 1 minutę w tym przypadku.
Gdy twoje dane są gotowe do pobrania, kliknij przycisk CSV/Excel. Teraz możesz zapisać i zmienić nazwę swojego pliku.

Pobieranie obrazów na urządzenie

Teraz, gdy mamy listę wszystkich adresów URL dla każdego obrazu, pójdziemy dalej i pobierzemy je na nasze urządzenie za pomocą jednego prostego narzędzia.

W tym celu użyjemy rozszerzenia Tab Save chrome.

Po zainstalowaniu w przeglądarce, otwórz rozszerzenie klikając na jego ikonę. To otworzy rozszerzenie, a następnie kliknij na przycisk edycji w lewym dolnym rogu, aby wprowadzić adresy URL, które właśnie wyodrębniliśmy.

Po kliknięciu na ikonę pobierania w prawym dolnym rogu okna rozszerzenia, wszystkie obrazy zostaną automatycznie pobrane na urządzenie. Może to potrwać kilka sekund w zależności od ilości pobieranych obrazów.

Pomysły końcowe

Postępując zgodnie z każdym krokiem w tym przewodniku, skończysz z folderem wszystkich obrazów, które musiałeś pobrać. W tym przypadku, pobraliśmy ponad 330 obrazów z Amazon w mniej niż 5 minut.

Teraz, jeśli mi wybaczysz, muszę iść i usunąć wszystkie te obrazy z mojego dysku twardego.

Download ParseHub for Free today

Możesz być również zainteresowany czytaniem innych przewodników:

Jak używać narzędzia do ekstrakcji danych do skrobania AutoTrader
Scraping Rakuten Data
Jak skrobać dane produktów Amazon: Nazwy, ceny, ASIN, itp

Jak zeskrobać dane o produktach Amazon?

ParseHub i Web Scraping

Scraping adresów URL obrazów

Rozpoczynanie

Tworzenie projektu

Wybieranie obrazów do skrobania

Paginacja

Skrobanie i eksport danych

Pobieranie obrazów na urządzenie

Pomysły końcowe

Related Posts

Ciśnienie krwi 102 powyżej 50?

The 13 Species of Owls in Colorado

21 Low Carb Mediterranean Diet Recipes

Dodaj komentarz Anuluj pisanie odpowiedzi