Při výzkumu s větším množstvím dat je nutné přestat analyzovat data v Excelu a najít výkonnější software. Může se to zdát jako opravdu náročný úkol, zejména pokud jste se nikdy předtím nepokoušeli analyzovat velká data. Existuje řada softwarových systémů pro analýzu dat, ale ne vždy je jasné, který z nich bude pro váš výzkum nejvhodnější. V tom, který software bude pro vás nejlepší, bude hrát roli povaha vašich výzkumných dat, vaše technologické znalosti a vaše osobní preference. V tomto příspěvku vysvětlím výhody a nevýhody programů Stata, R a SPSS s ohledem na kvantitativní analýzu dat a uvedu odkazy na další zdroje. Každý software pro analýzu dat, o kterém v tomto příspěvku hovořím, je k dispozici studentům, vyučujícím a zaměstnancům Illinoiské univerzity prostřednictvím počítačů Scholarly Commons a v případě konkrétních dotazů si můžete domluvit konzultaci s CITL.
Vylepšete svůj výzkum pomocí správných nástrojů!
Mezi výzkumníky je Stata často považována za uživatelsky nejpřívětivější software pro analýzu dat. Stata je oblíbená ve společenských vědách, zejména v ekonomii a politologii. Jedná se o kompletní, integrovaný balík statistického softwaru, což znamená, že dokáže splnit prakticky jakoukoli statistickou úlohu, kterou potřebujete, včetně vizualizací. Má uživatelské rozhraní typu „ukaž a klikni“ i funkci příkazového řádku se snadno naučitelnou syntaxí příkazů. Kromě toho má zavedený systém pro kontrolu verzí, takže si můžete syntaxi určitých úloh uložit do „do-file“ a později se k ní vrátit. Stata není na vašem osobním počítači zdarma. Na rozdíl od open-source programu nemůžete do Staty naprogramovat vlastní funkce, takže jste omezeni na funkce, které již podporuje. A konečně, její funkce jsou omezeny na numerická nebo kategoriální data, neumí analyzovat prostorová data a některé další typy.
Pros |
Cons |
---|---|
Uživatelsky přívětivý a snadno se učí | Individuální licence může stát od 125 do 425 dolarů ročně |
Kontrola verzí | Omezeno na určité typy dat |
Mnoho bezplatných online zdrojů pro výuku | Nové funkce do Staty naprogramovat nelze |
Další zdroje:
- Kanál STATA na YouTube:
- A Gentle Introduction to STATA by Alan C. Acock:
- Stata.com Resources for learning STATA: Mnoho informací o tom, jak provádět konkrétní funkce ve Statě.
- The University Library’s Guide on STATA: Skvělé místo, kde najdete odkazy na další zdroje o Stata.
R
R a jeho průvodce grafickým uživatelským rozhraním R Studio jsou neuvěřitelně populární software z mnoha důvodů. Prvním a pravděpodobně nejdůležitějším je, že se jedná o bezplatný software s otevřeným zdrojovým kódem, který je kompatibilní s jakýmkoli operačním systémem. Jako takový má silnou a loajální komunitu uživatelů, kteří sdílejí svou práci a rady online. Má stejné vlastnosti jako Stata, jako je uživatelské rozhraní typu „ukaž a klikni“, příkazový řádek, ukládané soubory a silné možnosti analýzy a vizualizace dat. Má také některé možnosti, které Stata nemá, protože uživatelé s většími technickými znalostmi mohou v R naprogramovat nové funkce a používat jej pro různé typy dat a projektů. Problém, na který mnoho lidí u R naráží, je, že není snadné se jej naučit. Programovací jazyk, se kterým pracuje, není intuitivní a je náchylný k chybám. Navzdory této strmé křivce učení existuje množství bezplatných online zdrojů pro výuku jazyka R.
Pros |
Proti |
---|---|
Zdarma otevřený-source software | Složitá křivka učení |
Silná online komunita uživatelů | Může být pomalý |
Programovatelný s více funkcemi pro analýzu dat |
Další zdroje:
- Průvodce úvodem do knihovny R:
- Quick-R by DataCamp:
- Learn R on Code Academy: Tento web nabízí výukové programy a příklady syntaxe pro celou řadu funkcí analýzy dat v R. Vše od instalace balíčku až po pokročilé vizualizace dat:
- Fórum Nabble: Bezplatná online třída pro samouky, kde se můžete naučit používat R nejen pro datovou vědu:
SPSS
SPSS je produkt společnosti IBM, který se používá pro kvantitativní analýzu dat. Nemá funkci příkazového řádku, ale má uživatelské rozhraní, které je zcela typu „ukaž a klikni“ a poněkud připomíná Microsoft Excel. Přestože vypadá podobně jako Excel, dokáže rychleji a snadněji zpracovávat větší soubory dat. Jednou z hlavních stížností na SPSS je, že jeho používání je neúměrně drahé – jednotlivé balíčky se pohybují od 1 290 do 8 540 dolarů ročně. Abychom vynahradili to, jak je drahý, je neuvěřitelně snadné se jej naučit. Jako netechnický člověk jsem se ho naučil používat za méně než hodinu podle online výukového programu z knihovny Illinoiské univerzity. Nicméně můj názor na tento software je, že pokud opravdu nepotřebujete výkonnější nástroj, zůstaňte u Excelu. Jsou si příliš podobné na to, aby se vyplatilo hledat tento specializovaný software.
Pros |
Proti |
---|---|
Rychle a snadno se učí | Je zdaleka nejdražší |
Může. zvládne velké množství dat | Omezené funkce |
Skvělé uživatelské rozhraní | Velmi podobné Excelu |
Další zdroje:
- OpenLearn- Getting Started with SPSS: Bezplatná a otevřená online třída pro výuku používání SPSS pro analýzu dat.
- Vzdělávání na síti LinkedIn: Školení SPSS Statistics Essentials:
- How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: Tato kniha je průvodcem začátečníků v používání SPSS pro analýzu dat, který je k dispozici v kolekci Scholarly Commons.