Når man forsker i større datamængder, bliver det nødvendigt at gå fra at lave dataanalyse i Excel til at finde en mere kraftfuld software. Det kan virke som en virkelig skræmmende opgave, især hvis du aldrig har forsøgt at analysere store data før. Der findes en række dataanalysesoftwaresystemer, men det er ikke altid klart, hvilket system der vil fungere bedst til din forskning. Karakteren af dine forskningsdata, din teknologiske ekspertise og dine egne personlige præferencer vil alle spille en rolle i forhold til, hvilken software der vil fungere bedst for dig. I dette indlæg vil jeg forklare fordele og ulemper ved Stata, R og SPSS med hensyn til kvantitativ dataanalyse og give links til yderligere ressourcer. Hver dataanalysesoftware, som jeg taler om i dette indlæg, er tilgængelig for studerende, fakultetet og personale på University of Illinois via Scholarly Commons-computerne, og du kan planlægge en konsultation med CITL, hvis du har specifikke spørgsmål.
Rock din forskning med de rigtige værktøjer!
Men blandt forskere bliver Stata ofte krediteret som den mest brugervenlige dataanalysesoftware. Stata er populært inden for samfundsvidenskab, især økonomi og statskundskab. Det er en komplet, integreret statistisk softwarepakke, hvilket betyder, at den kan udføre stort set alle statistiske opgaver, som du har brug for, herunder visualiseringer. Det har både en peg-og-klik-brugergrænseflade og en kommandolinjefunktion med en kommandosyntaks, der er let at lære. Desuden har det et system til versionskontrol på plads, så du kan gemme syntaks fra visse opgaver i en “do-fil”, som du kan henvise til senere. Stata er ikke gratis at have på din personlige computer. I modsætning til et open source-program kan du ikke programmere dine egne funktioner ind i Stata, så du er begrænset til de funktioner, som det allerede understøtter. Endelig er dets funktioner begrænset til numeriske eller kategoriske data, og det kan ikke analysere rumlige data og visse andre typer data.
Pros |
Cons |
---|---|
Brugervenlig og nem at lære | En individuel licens kan koste mellem 125 og 425 dollars årligt |
Versionskontrol | Begrænset til visse typer data |
Mange gratis online ressourcer til læring | Du kan ikke programmere nye funktioner i Stata |
Overfladelige ressourcer:
- STATA YouTube-kanal: En fantastisk ressource til fejlfinding af problemer i Stata.
- A Gentle Introduction to STATA af Alan C. Acock: En god reference til at komme i gang med Stata, der er tilgængelig via Scholarly Commons-samlingen.
- Stata.com Resources for learning STATA: Masser af oplysninger om, hvordan man udfører specifikke funktioner i Stata.
- The University Library’s Guide on STATA: Et godt sted at finde links til yderligere ressourcer om Stata.
R
R og dets grafiske brugergrænsefladekompagnon R Studio er utroligt populært software af flere grunde. Den første og nok vigtigste er, at det er en gratis open source-software, der er kompatibel med alle styresystemer. Som sådan er der et stærkt og loyalt fællesskab af brugere, som deler deres arbejde og råd online. Det har de samme funktioner som Stata, f.eks. en peg-og-klik-brugergrænseflade, en kommandolinje, filer der kan gemmes, og stærke dataanalyse- og visualiseringsmuligheder. Det har også nogle funktioner, som Stata ikke har, fordi brugere med mere teknisk ekspertise kan programmere nye funktioner med R for at bruge det til forskellige typer data og projekter. Det problem, som mange mennesker løber ind i med R, er, at det ikke er let at lære. Det programmeringssprog, det opererer på, er ikke intuitivt, og det er tilbøjeligt til at begå fejl. På trods af denne stejle indlæringskurve findes der et væld af gratis online ressourcer til at lære R.
Pros |
Cons |
|
---|---|---|
Gratis åben-source software | Strap indlæringskurve | |
Stort online brugerfællesskab | Kan være langsomt | |
Programmerbart med flere funktioner til dataanalyse |
Overfladelige ressourcer:
- Introduktion til R-biblioteksguide:
- Introduktion til R-biblioteket: Find værdifulde oversigter og vejledninger i denne vejledning, der er udgivet af University of Illinois Library.
- Quick-R by DataCamp: Dette websted tilbyder vejledninger og eksempler på syntaks for en lang række dataanalysefunktioner i R. Alt fra installation af pakken til avancerede datavisualiseringer.
- Lær R på Code Academy: En gratis online-undervisning med selvstyring for at lære at bruge R til datavidenskab og andet.
- Nabble-forum: Et forum, hvor enkeltpersoner kan stille specifikke spørgsmål om brug af R og få svar fra brugerfællesskabet.
SPSS
SPSS er et IBM-produkt, der bruges til kvantitativ dataanalyse. Det har ikke en kommandolinjefunktion, men har snarere en brugergrænseflade, der udelukkende er point-and-click og minder lidt om Microsoft Excel. Selv om det ligner Excel meget, kan det håndtere større datasæt hurtigere og med større lethed. En af de vigtigste klager over SPSS er, at det er uoverkommeligt dyrt at bruge, idet de enkelte pakker koster mellem 1.290 og 8.540 dollars om året. For at kompensere for hvor dyrt det er, er det utrolig nemt at lære. Som ikke-teknisk person lærte jeg at bruge det på under en time ved at følge en online-vejledning fra University of Illinois Library. Min holdning til denne software er dog, at medmindre du virkelig har brug for et mere kraftfuldt værktøj, skal du bare holde dig til Excel. De ligner hinanden for meget til at retfærdiggøre, at man skal søge efter denne specialiserede software.
Pros
Cons
Snapt og nemt at lære Langt det dyreste Kan håndtere store datamængder Begrænset funktionalitet God brugergrænseflade Ligner meget Excel Overfladelige ressourcer:
- OpenLearn- Getting Started with SPSS: Et gratis og åbent onlinekursus for at lære at bruge SPSS til dataanalyse.
- LinkedIn Learning: SPSS Statistics Essentials Training: Gratis onlinekursus til at lære det grundlæggende i SPSS.
- How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: Denne bog er en begynderguide til at bruge SPSS til dataanalyse, som er tilgængelig via Scholarly Commons-samlingen.