Pobieranie dużej ilości obrazów ze strony internetowej może być dość czasochłonne.
Kliknij prawym przyciskiem myszy, Zapisz obraz jako…, powtarzaj ad nauseam.
W tych przypadkach, skrobanie stron internetowych jest rozwiązaniem twojego problemu. W tym poradniku, przejdziemy do tego jak wyodrębnić adres URL dla każdego obrazu na stronie internetowej używając darmowego web scrapera.
Przejdziemy również do tego jak użyć tej wyodrębnionej listy aby szybko pobrać wszystkie obrazy na swój komputer.
Nie krępuj się kliknąć na którykolwiek z linków, aby przejść do określonej części przewodnika
ParseHub i Web Scraping
Aby wykonać to proste zadanie, będziesz potrzebował web scrapera, który może zbierać adresy URL, o których mowa. ParseHub jest darmowym i niesamowicie potężnym web scraperem, idealnym kandydatem do tego zadania.
Pewnie pobierz i zainstaluj ParseHub przed rozpoczęciem pracy.
Scraping adresów URL obrazów
Dla tego przykładu, założymy, że jesteśmy zainteresowani pobraniem każdego obrazu z pierwszych 5 stron wyników na Amazon.ca dla „bezprzewodowych wkładek dousznych”. Ta informacja może być potencjalnie bardzo cenna dla analizy konkurencji.
Rozpoczynanie
- Po pobraniu ParseHub, upewnij się, że masz go uruchomionego na swoim komputerze.
- Wybierz konkretny adres URL strony, którą będziemy skrobać.
Tworzenie projektu
- W ParseHub, kliknij na „Nowy projekt” i wprowadź adres URL strony Amazon, którą będziemy skrobać.
- Strona internetowa będzie teraz renderowana w ParseHub i będziesz mógł wybrać obrazy, które chcesz zeskrobać.
Wybieranie obrazów do skrobania
- Zacznij od wybrania pierwszego obrazu z wyników wyszukiwania. Następnie zmieni on kolor na zielony, co oznacza, że został wybrany do zeskrobania.
- Reszta obrazów na stronie wyników wyszukiwania zmieni kolor na żółty. Kliknij na drugi obrazek, aby wybrać wszystkie obrazki na stronie. Wszystkie zmienią kolor na zielony, co oznacza, że zostały wybrane do wyodrębnienia.
- Ponieważ te obrazy działają również jako linki do stron produktów, ParseHub wyodrębnia zarówno adres URL obrazu jak i link, na który wskazuje (strona produktu). W rezultacie usuniemy selekcję URL z lewego paska bocznego i zachowamy tylko selekcję obrazów.
- Teraz ParseHub będzie skrobał każdy URL obrazu dla pierwszej strony wyników.
Paginacja
Teraz musimy powiedzieć ParseHub, aby wyodrębnił te same informacje, ale dla kolejnych 5 stron wyników wyszukiwania.
- Kliknij na znak PLUS(+) obok wyboru strony i użyj polecenia select.
- Potem klikamy na przycisk „Next” i na dole strony z wynikami wyszukiwania.
- Domyślnie ParseHub wyodrębnia link z przycisku Next. Klikamy więc na ikonę obok zaznaczenia „Next” i usuwamy dwa elementy znajdujące się pod nim.
- Wtedy użyjemy znaku PLUS(+) obok zaznaczenia „Następny” i użyjemy polecenia „kliknij”.
- Wystąpi okno z pytaniem, czy jest to link Następna strona. Kliknij „Tak” i wpisz liczbę powtórzeń tego cyklu. Dla tego przykładu, zrobimy to 5 razy.
Skrobanie i eksport danych
Teraz nadchodzi część zabawy, pozwolimy ParseHubowi uruchomić i wyodrębnić listę adresów URL dla każdego obrazu, który wybraliśmy.
- Kliknij na przycisk „Pobierz dane” na lewym pasku bocznym.
- Tutaj możesz wybrać, kiedy uruchomić skrobanie. Chociaż zawsze zalecamy przetestowanie działania scrape’u przed uruchomieniem pełnego scrape’u, po prostu uruchomimy scrape teraz dla tego przykładu.
- Teraz ParseHub będzie skrobał adresy URL obrazów, które wybrałeś. Możesz czekać na tym ekranie lub opuścić ParseHub, zostaniesz powiadomiony po zakończeniu skrobania. Ten proces trwał mniej niż 1 minutę w tym przypadku.
- Gdy twoje dane są gotowe do pobrania, kliknij przycisk CSV/Excel. Teraz możesz zapisać i zmienić nazwę swojego pliku.
Pobieranie obrazów na urządzenie
Teraz, gdy mamy listę wszystkich adresów URL dla każdego obrazu, pójdziemy dalej i pobierzemy je na nasze urządzenie za pomocą jednego prostego narzędzia.
W tym celu użyjemy rozszerzenia Tab Save chrome.
Po zainstalowaniu w przeglądarce, otwórz rozszerzenie klikając na jego ikonę. To otworzy rozszerzenie, a następnie kliknij na przycisk edycji w lewym dolnym rogu, aby wprowadzić adresy URL, które właśnie wyodrębniliśmy.
Po kliknięciu na ikonę pobierania w prawym dolnym rogu okna rozszerzenia, wszystkie obrazy zostaną automatycznie pobrane na urządzenie. Może to potrwać kilka sekund w zależności od ilości pobieranych obrazów.
Pomysły końcowe
Postępując zgodnie z każdym krokiem w tym przewodniku, skończysz z folderem wszystkich obrazów, które musiałeś pobrać. W tym przypadku, pobraliśmy ponad 330 obrazów z Amazon w mniej niż 5 minut.
Teraz, jeśli mi wybaczysz, muszę iść i usunąć wszystkie te obrazy z mojego dysku twardego.
Download ParseHub for Free today
Możesz być również zainteresowany czytaniem innych przewodników:
- Jak używać narzędzia do ekstrakcji danych do skrobania AutoTrader
- Scraping Rakuten Data
- Jak skrobać dane produktów Amazon: Nazwy, ceny, ASIN, itp
Jak zeskrobać dane o produktach Amazon?