Commons Knowledge

När du forskar med större mängder data blir det nödvändigt att sluta göra dataanalysen i Excel och hitta en mer kraftfull programvara. Det kan verka som en riktigt skrämmande uppgift, särskilt om du aldrig tidigare har försökt analysera stora data. Det finns ett antal programvarusystem för dataanalys där ute, men det är inte alltid självklart vilken som fungerar bäst för din forskning. Karaktären på dina forskningsdata, din tekniska expertis och dina egna personliga preferenser kommer alla att spela en roll för vilken programvara som kommer att fungera bäst för dig. I det här inlägget kommer jag att förklara för- och nackdelar med Stata, R och SPSS när det gäller kvantitativ dataanalys och ge länkar till ytterligare resurser. Varje programvara för dataanalys som jag talar om i det här inlägget är tillgänglig för studenter, lärare och personal vid University of Illinois via Scholarly Commons-datorerna och du kan boka in en konsultation med CITL om du har specifika frågor.

Rockera din forskning med de rätta verktygen!

Under forskare är Stata ofta ansedd som den mest användarvänliga programvaran för dataanalys. Stata är populärt inom samhällsvetenskaperna, särskilt inom ekonomi och statsvetenskap. Det är ett komplett, integrerat statistiskt programpaket, vilket innebär att det kan utföra i stort sett alla statistiska uppgifter du behöver, inklusive visualiseringar. Det har både ett användargränssnitt som pekar och klickar och en kommandoradsfunktion med lättlärd kommandosyntax. Dessutom har det ett system för versionskontroll på plats, så att du kan spara syntax från vissa jobb i en ”do-fil” för att hänvisa till den senare. Stata är inte gratis att ha på din dator. Till skillnad från ett program med öppen källkod kan du inte programmera in egna funktioner i Stata, så du är begränsad till de funktioner som det redan stöder. Slutligen är dess funktioner begränsade till numeriska eller kategoriska data, det kan inte analysera rumsliga data och vissa andra typer.

.

Pros

Cons

Användarvänligt och lätt att lära sig En enskild licens kan kosta
mellan 125 och 425 dollar per år
Versionskontroll Begränsad till vissa typer av data
Många kostnadsfria online-resurser för inlärning Du kan inte programmera nya
funktioner i Stata

Övriga resurser:

  • STATA YouTube-kanal:
  • A Gentle Introduction to STATA av Alan C. Acock: En bra referens för att komma igång med Stata, tillgänglig via Scholarly Commons-samlingen.
  • Stata.com Resources for learning STATA: Mycket information om hur man utför specifika funktioner i Stata.
  • The University Library’s Guide on STATA: Ett bra ställe att hitta länkar till ytterligare resurser om Stata.

R

R och dess grafiska användargränssnittskompanjon R Studio är otroligt populära programvaror av flera skäl. Det första och förmodligen viktigaste är att det är en gratis programvara med öppen källkod som är kompatibel med alla operativsystem. Som sådan finns det en stark och lojal gemenskap av användare som delar med sig av sitt arbete och sina råd på nätet. Den har samma funktioner som Stata, t.ex. ett användargränssnitt som pekar och klickar, en kommandorad, filer som kan sparas och starka funktioner för dataanalys och visualisering. Det har också vissa funktioner som Stata inte har eftersom användare med mer teknisk expertis kan programmera nya funktioner med R för att använda det för olika typer av data och projekt. Problemet som många stöter på med R är att det inte är lätt att lära sig det. Programmeringsspråket som det fungerar på är inte intuitivt och det är känsligt för fel. Trots denna branta inlärningskurva finns det ett överflöd av gratis resurser online för att lära sig R.

Pros

Cons

Fri öppen-source software Step learning curve
Strong online user community Can be slow
Programmerbar med fler funktioner
för dataanalys

Tilläggsresurser:

  • Introduktion till R Library Guide: Hitta värdefulla översikter och handledningar i denna guide som publicerats av University of Illinois Library.
  • Quick-R by DataCamp: Allt från installation av paketet till avancerade datavisualiseringar.
  • Learn R on Code Academy: Lär dig R på Code Academy: En kostnadsfri självstyrande onlineklass för att lära sig att använda R för datavetenskap och annat.
  • Nabble-forum: Ett forum där personer kan ställa specifika frågor om hur man använder R och få svar från användargruppen.

SPSS

SPSS är en IBM-produkt som används för kvantitativ dataanalys. Den har ingen kommandoradsfunktion utan har snarare ett användargränssnitt som är helt och hållet peka-och-klicka- och som till viss del liknar Microsoft Excel. Även om den ser mycket ut som Excel kan den hantera större datamängder snabbare och med större lätthet. Ett av de största klagomålen mot SPSS är att det är oöverkomligt dyrt att använda, med enskilda paket som kostar mellan 1 290 och 8 540 dollar per år. För att kompensera för hur dyrt det är är det otroligt lätt att lära sig. Som icke-teknisk person lärde jag mig att använda det på mindre än en timme genom att följa en handledning online från University of Illinois Library. Min åsikt om denna programvara är dock att om du inte verkligen behöver ett mer kraftfullt verktyg ska du hålla dig till Excel. De är alltför lika varandra för att motivera att man söker sig till denna specialiserade programvara.

Pros

Cons

Snabbt och enkelt att lära sig Den överlägset dyraste
Kan. hantera stora mängder data Begränsad funktionalitet
Gott användargränssnitt Som mycket lik Excel

Tilläggsresurser:

  • OpenLearn- Getting Started with SPSS: En gratis och öppen onlinekurs för att lära sig använda SPSS för dataanalys.
  • LinkedIn Learning: SPSS Statistics Essentials Training: Gratis onlinekurs för att lära sig grunderna i SPSS.
  • How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: Den här boken är en nybörjarguide om hur man använder SPSS för dataanalys och är tillgänglig via Scholarly Commons-samlingen.

Lämna ett svar

Din e-postadress kommer inte publiceras.