Kun teet tutkimusta suuremmilla tietomäärillä, on välttämätöntä siirtyä tekemään data-analyysi Excelissä ja löytää tehokkaampi ohjelmisto. Se voi tuntua todella pelottavalta tehtävältä, varsinkin jos et ole koskaan aiemmin yrittänyt analysoida suurta dataa. Tarjolla on useita data-analyysiohjelmistoja, mutta aina ei ole selvää, mikä niistä sopii parhaiten tutkimukseesi. Tutkimusaineistosi luonne, teknologinen asiantuntemuksesi ja omat henkilökohtaiset mieltymyksesi vaikuttavat siihen, mikä ohjelmisto sopii sinulle parhaiten. Tässä postauksessa selitän Statan, R:n ja SPSS:n hyviä ja huonoja puolia kvantitatiivisen aineiston analyysin kannalta ja annan linkkejä lisäresursseihin. Jokainen data-analyysiohjelmisto, josta puhun tässä postauksessa, on saatavilla Illinoisin yliopiston opiskelijoille, tiedekunnalle ja henkilökunnalle Scholarly Commons -tietokoneiden kautta, ja voit varata ajan konsultaatioon CITL:n kanssa, jos sinulla on tarkempia kysymyksiä.
Rokkaa tutkimustasi oikeilla työkaluilla!
Tutkijoiden keskuudessa Stataa pidetään usein helppokäyttöisimpänä data-analyysiohjelmana. Stata on suosittu yhteiskuntatieteissä, erityisesti taloustieteissä ja valtiotieteissä. Se on täydellinen, integroitu tilasto-ohjelmistopaketti, mikä tarkoittaa, että sillä voi suorittaa lähes kaikki tarvitsemasi tilastolliset tehtävät, mukaan lukien visualisoinnit. Siinä on sekä osoita ja napsauta -käyttöliittymä että komentorivitoiminto, jossa on helposti opittava komentosyntaksi. Lisäksi siinä on versionhallintajärjestelmä, joten voit tallentaa tiettyjen töiden syntaksin ”do-tiedostoon”, johon voit viitata myöhemmin. Stata ei ole ilmainen tietokoneellesi. Toisin kuin avoimen lähdekoodin ohjelmissa, et voi ohjelmoida omia funktioita Stataan, joten voit käyttää vain sen jo tukemia funktioita. Lisäksi sen toiminnot rajoittuvat numeerisiin tai kategorisiin tietoihin, eikä sillä voi analysoida paikkatietoaineistoja tai tietyntyyppisiä muita tietoja.
Plussat |
Miinukset |
---|---|
Käyttäjäystävällinen ja helppo oppia | Yksittäinen lisenssi voi maksaa 125-425 dollaria vuodessa |
Versiohallinta | Rajoitettu tietyntyyppisiin aineistoihin |
Lukuisia ilmaisia online-resursseja oppimiseen | Ei voi ohjelmoida uusia funktioita Stataan |
Lisäresursseja:
- STATA YouTube-kanava: Loistava resurssi ongelmien ratkaisemiseen Statassa.
- A Gentle Introduction to STATA by Alan C. Acock:
- Stata.com Resources for learning STATA: Paljon tietoa siitä, miten tiettyjä funktioita suoritetaan Statassa.
- The University Library’s Guide on STATA: Hieno paikka, josta löytyy linkkejä Stataa koskeviin lisäresursseihin.
R
R ja sen graafinen käyttöliittymäkumppani R Studio ovat uskomattoman suosittuja ohjelmistoja monesta syystä. Ensimmäinen ja luultavasti tärkein on se, että se on ilmainen avoimen lähdekoodin ohjelmisto, joka on yhteensopiva minkä tahansa käyttöjärjestelmän kanssa. Näin ollen on olemassa vahva ja uskollinen käyttäjäyhteisö, joka jakaa työtään ja neuvojaan verkossa. Ohjelmassa on samat ominaisuudet kuin Statassa, kuten osoita ja napsauta -käyttöliittymä, komentorivi, tallennettavat tiedostot sekä vahvat data-analyysi- ja visualisointiominaisuudet. Sillä on myös joitakin ominaisuuksia, joita Statalla ei ole, koska käyttäjät, joilla on enemmän teknistä asiantuntemusta, voivat ohjelmoida uusia toimintoja R:llä ja käyttää sitä erityyppisiin aineistoihin ja projekteihin. Ongelma, johon monet ihmiset törmäävät R:n kanssa, on se, että sitä ei ole helppo oppia. Sen käyttämä ohjelmointikieli ei ole intuitiivinen ja se on altis virheille. Tästä jyrkästä oppimiskäyrästä huolimatta R:n oppimiseen on tarjolla runsaasti ilmaisia online-resursseja.
Pros |
Cons |
---|---|
Vapaa open-lähdekoodin ohjelmisto | Pitkä oppimiskäyrä |
Vahva verkkokäyttäjäyhteisö | Voi olla hidas |
Ohjelmoitavissa useammilla toiminnoilla data-analyysiä varten |
Lisäresursseja:
- Introduction to R Library Guide: Tästä Illinoisin yliopiston kirjaston julkaisemasta oppaasta löydät arvokkaita yleiskatsauksia ja opetusohjelmia.
- Quick-R by DataCamp: Tämä sivusto tarjoaa opetusohjelmia ja esimerkkejä syntaksista koko joukolle data-analyysitoimintoja R:ssä. Kaikki paketin asentamisesta edistyneisiin datan visualisointeihin.
- Learn R on Code Academy: Ilmainen itseopiskeleva verkkokurssi, jolla voi oppia käyttämään R:ää datatieteessä ja sen ulkopuolella.
- Nabble-foorumi: Foorumi, jossa yksityishenkilöt voivat esittää erityisiä kysymyksiä R:n käytöstä ja saada vastauksia käyttäjäyhteisöltä.
SPSS
SPSS on IBM:n tuote, jota käytetään kvantitatiiviseen data-analyysiin. Siinä ei ole komentoriviominaisuutta, vaan sen käyttöliittymä on täysin osoita ja napsauta ja muistuttaa hieman Microsoft Exceliä. Vaikka se näyttää paljon Exceliltä, se pystyy käsittelemään suurempia tietokokonaisuuksia nopeammin ja helpommin. Yksi tärkeimmistä SPSS:ää koskevista valituksista on, että sen käyttö on kohtuuttoman kallista, sillä yksittäisten pakettien hinnat vaihtelevat 1 290 dollarista 8 540 dollariin vuodessa. Sen kalleutta kompensoi se, että se on uskomattoman helppo oppia. Koska en ole teknikko, opin käyttämään sitä alle tunnissa seuraamalla Illinoisin yliopiston kirjaston verkko-opastusta. Oma mielipiteeni tästä ohjelmistosta on kuitenkin se, että jos et todella tarvitse tehokkaampaa työkalua, pysy Excelissä. Ne ovat liian samankaltaisia, jotta tämän erikoisohjelmiston hankkiminen olisi perusteltua.
Plussat |
Miinukset |
---|---|
Nopea ja helppo oppia | Se on ylivoimaisesti kallein |
Voi käsitellä suuria tietomääriä | Rajoitetut toiminnot |
Hyvä käyttöliittymä | Hyvin samankaltainen kuin Excel |
Lisää resursseja:
- OpenLearn- Getting Started with SPSS: Ilmainen ja avoin verkkokurssi SPSS:n käytön opetteluun data-analyysissä.
- LinkedIn Learning: SPSS Statistics Essentials -koulutus: Ilmainen verkkoluokka SPSS:n perusteiden oppimiseen.
- How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: Tämä kirja on aloittelijan opas SPSS:n käyttämiseen data-analyyseissä, joka on saatavilla Scholarly Commons -kokoelman kautta.