Jak prowadzisz badania z większymi ilościami danych, konieczne staje się porzucenie analizy danych w Excelu i znalezienie bardziej wydajnego oprogramowania. Może się to wydawać naprawdę zniechęcającym zadaniem, zwłaszcza jeśli nigdy wcześniej nie próbowałeś analizować dużych danych. Istnieje wiele systemów oprogramowania do analizy danych, ale nie zawsze jest jasne, który z nich będzie działał najlepiej dla Twoich badań. Charakter Twoich danych badawczych, Twoja wiedza technologiczna i Twoje osobiste preferencje odegrają rolę w tym, które oprogramowanie będzie dla Ciebie najlepsze. W tym poście wyjaśnię wady i zalety programów Stata, R i SPSS w odniesieniu do ilościowej analizy danych i podam linki do dodatkowych zasobów. Każde oprogramowanie do analizy danych, o którym mówię w tym poście jest dostępne dla studentów, wykładowców i pracowników University of Illinois poprzez komputery Scholarly Commons i możesz umówić się na konsultację z CITL, jeśli masz konkretne pytania.
Rock your research with the right tools!
Wśród naukowców, Stata jest często uznawana za najbardziej przyjazne dla użytkownika oprogramowanie do analizy danych. Stata jest popularna w naukach społecznych, szczególnie w ekonomii i naukach politycznych. Jest to kompletny, zintegrowany pakiet oprogramowania statystycznego, co oznacza, że może wykonać prawie każde zadanie statystyczne, którego potrzebujesz, w tym wizualizacje. Posiada zarówno interfejs użytkownika typu „wskaż i kliknij”, jak i funkcję wiersza poleceń z łatwą do nauczenia się składnią poleceń. Co więcej, posiada system kontroli wersji, dzięki czemu można zapisać składnię niektórych zadań w „do-file”, aby móc się do nich później odwołać. Stata nie jest darmowa do posiadania na swoim komputerze osobistym. W przeciwieństwie do programów open-source, nie możesz zaprogramować własnych funkcji do Staty, więc jesteś ograniczony do funkcji już obsługiwanych przez program. Wreszcie, jego funkcje są ograniczone do danych numerycznych lub kategorycznych, nie może analizować danych przestrzennych i niektórych innych typów.
Zalety |
Konsekwencje |
---|---|
Przyjazny dla użytkownika i łatwy do nauczenia | Indywidualna licencja może kosztować między 125$ a 425$ rocznie |
Kontrola wersji | Limitowany do pewnych typów danych |
Wiele darmowych zasobów online do nauki | Nie można zaprogramować nowych funkcji w Stata |
Dodatkowe zasoby:
- STATA YouTube Channel: Świetne źródło informacji na temat rozwiązywania problemów w Stata.
- A Gentle Introduction to STATA by Alan C. Acock: Świetna referencja do rozpoczęcia pracy ze Stata dostępna poprzez kolekcję Scholarly Commons.
- Stata.com Resources for learning STATA: Wiele informacji na temat wykonywania konkretnych funkcji w Stata.
- The University Library’s Guide on STATA: Świetne miejsce, aby znaleźć linki do dodatkowych zasobów na temat Stata.
R
R i jego graficzny interfejs użytkownika towarzysz R Studio są niewiarygodnie popularnym oprogramowaniem z wielu powodów. Pierwszym i prawdopodobnie najważniejszym jest to, że jest to darmowe oprogramowanie open-source, które jest kompatybilne z każdym systemem operacyjnym. Jako takie, istnieje silna i lojalna społeczność użytkowników, którzy dzielą się swoją pracą i poradami online. Posiada te same cechy co Stata, takie jak interfejs użytkownika typu „wskaż i kliknij”, wiersz poleceń, zapisywalne pliki oraz silne możliwości analizy i wizualizacji danych. Posiada również pewne możliwości, których Stata nie posiada, ponieważ użytkownicy z większą wiedzą techniczną mogą programować nowe funkcje w R, aby używać go do różnych typów danych i projektów. Problemem, na który napotyka wiele osób używających R jest to, że nie jest on łatwy do nauczenia. Język programowania, na którym działa, nie jest intuicyjny i jest podatny na błędy. Pomimo tej stromej krzywej uczenia się, istnieje wiele darmowych zasobów online do nauki R.
Pros |
Cons |
---|---|
Darmowe oprogramowanie open-source software | Steep learning curve |
Strong online user community | Can be slow |
Programable with more functions for data analysis |
Additional Resources:
- Wprowadzenie do biblioteki R Przewodnik po bibliotece R: Znajdź cenne przeglądy i samouczki w tym przewodniku opublikowanym przez University of Illinois Library.
- Quick-R by DataCamp: Ta strona oferuje samouczki i przykłady składni dla całego mnóstwa funkcji analizy danych w R. Wszystko od instalacji pakietu do zaawansowanych wizualizacji danych.
- Learn R on Code Academy: Bezpłatna, samodzielna klasa online do nauki używania R do nauki o danych i nie tylko.
- Forum Nabble: Forum, na którym osoby mogą zadawać konkretne pytania dotyczące używania R i uzyskiwać odpowiedzi od społeczności użytkowników.
SPSS
SPSS to produkt IBM, który jest używany do ilościowej analizy danych. Nie posiada on funkcji wiersza poleceń, ale raczej posiada interfejs użytkownika, który jest całkowicie typu point-and-click i przypomina nieco Microsoft Excel. Chociaż wygląda jak Excel, może obsługiwać większe zbiory danych szybciej i z większą łatwością. Jednym z głównych zarzutów wobec SPSS jest to, że jest on niemiłosiernie drogi w użyciu, z indywidualnymi pakietami od $1,290 do $8,540 rocznie. Aby zrekompensować to, jak drogi jest, jest niewiarygodnie łatwy do nauczenia. Jako osoba nietechniczna nauczyłem się jak go używać w mniej niż godzinę, podążając za samouczkiem online z University of Illinois Library. Jednak moje zdanie na temat tego oprogramowania jest takie, że jeśli naprawdę nie potrzebujesz bardziej wydajnego narzędzia, po prostu trzymaj się Excela. Są one zbyt podobne, aby uzasadnić poszukiwanie tego specjalistycznego oprogramowania.
Pros |
Cons |
---|---|
Szybki i łatwy do nauczenia się | Daleko najdroższy |
Może obsługiwać duże ilości danych | Ograniczona funkcjonalność |
Wspaniały interfejs użytkownika | Bardzo podobny do Excela |
Dodatkowe zasoby:
- OpenLearn- Getting Started with SPSS: Bezpłatna i otwarta klasa online do nauki korzystania z SPSS do analizy danych.
- LinkedIn Learning: SPSS Statistics Essentials Training: Darmowa klasa online do nauki podstaw SPSS.
- How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: Ta książka jest przewodnikiem dla początkujących w używaniu SPSS do analizy danych dostępnym w kolekcji Scholarly Commons.