Wenn man mit größeren Datenmengen forscht, wird es notwendig, die Datenanalyse in Excel zu beenden und eine leistungsfähigere Software zu finden. Das kann eine wirklich entmutigende Aufgabe sein, besonders wenn Sie noch nie versucht haben, große Datenmengen zu analysieren. Es gibt eine Reihe von Software-Systemen für die Datenanalyse, aber es ist nicht immer klar, welches davon für Ihre Forschung am besten geeignet ist. Die Art Ihrer Forschungsdaten, Ihr technologisches Fachwissen und Ihre persönlichen Vorlieben spielen eine Rolle dabei, welche Software für Sie am besten geeignet ist. In diesem Beitrag werde ich die Vor- und Nachteile von Stata, R und SPSS in Bezug auf die quantitative Datenanalyse erläutern und Links zu weiteren Ressourcen bereitstellen. Jede Datenanalysesoftware, über die ich in diesem Beitrag spreche, ist für Studenten, Dozenten und Mitarbeiter der University of Illinois über die Scholarly Commons-Computer verfügbar, und Sie können einen Beratungstermin mit dem CITL vereinbaren, wenn Sie spezifische Fragen haben.
Bestehen Sie in Ihrer Forschung mit den richtigen Tools!
Unter Forschern wird Stata oft als die benutzerfreundlichste Datenanalysesoftware angesehen. Stata ist in den Sozialwissenschaften, insbesondere in den Wirtschafts- und Politikwissenschaften, sehr beliebt. Es ist ein vollständiges, integriertes statistisches Softwarepaket, das heißt, es kann so ziemlich jede statistische Aufgabe erfüllen, die Sie benötigen, einschließlich Visualisierungen. Es verfügt sowohl über eine Point-and-Click-Benutzeroberfläche als auch über eine Befehlszeilenfunktion mit leicht zu erlernender Befehlssyntax. Außerdem verfügt es über ein System zur Versionskontrolle, so dass Sie die Syntax bestimmter Aufgaben in einer „Do-Datei“ speichern können, um später darauf zurückzugreifen. Stata ist auf Ihrem Computer nicht kostenlos zu haben. Im Gegensatz zu einem Open-Source-Programm können Sie in Stata keine eigenen Funktionen programmieren, so dass Sie auf die bereits unterstützten Funktionen beschränkt sind. Schließlich sind die Funktionen auf numerische oder kategoriale Daten beschränkt, räumliche Daten und bestimmte andere Typen können nicht analysiert werden.
Pros |
Cons |
---|---|
Benutzerfreundlich und leicht zu erlernen | Eine Einzellizenz kann zwischen $125 und $425 jährlich kosten |
Versionskontrolle | Beschränkt auf bestimmte Datentypen |
Viele kostenlose Online-Ressourcen zum Lernen | Sie können keine neuen Funktionen in Stata programmieren |
Weitere Ressourcen:
- STATA YouTube Channel: Eine großartige Quelle für die Behebung von Problemen in Stata.
- A Gentle Introduction to STATA von Alan C. Acock: Ein hervorragendes Nachschlagewerk für den Einstieg in Stata, das über die Scholarly Commons-Sammlung verfügbar ist.
- Stata.com Resources for learning STATA: Viele Informationen darüber, wie man bestimmte Funktionen in Stata ausführt.
- The University Library’s Guide on STATA: Ein großartiger Ort, um Links zu zusätzlichen Ressourcen zu Stata zu finden.
R
R und seine grafische Benutzeroberfläche R Studio sind aus einer Reihe von Gründen unglaublich beliebte Software. Der erste und wahrscheinlich wichtigste ist, dass es sich um eine kostenlose Open-Source-Software handelt, die mit jedem Betriebssystem kompatibel ist. Als solche gibt es eine starke und treue Gemeinschaft von Benutzern, die ihre Arbeit und Ratschläge online teilen. Es verfügt über die gleichen Funktionen wie Stata, wie z. B. eine Point-and-Click-Benutzeroberfläche, eine Befehlszeile, speicherbare Dateien und starke Datenanalyse- und Visualisierungsfunktionen. Es hat auch einige Fähigkeiten, die Stata nicht hat, weil Benutzer mit mehr technischem Fachwissen neue Funktionen mit R programmieren können, um es für verschiedene Arten von Daten und Projekten zu verwenden. Das Problem, auf das viele Leute mit R stoßen, ist, dass es nicht leicht zu erlernen ist. Die Programmiersprache, mit der es arbeitet, ist nicht intuitiv, und es ist fehleranfällig. Trotz dieser steilen Lernkurve gibt es eine Fülle von kostenlosen Online-Ressourcen zum Erlernen von R.
Pros |
Cons |
---|---|
Freie Open-Source-Software | Steile Lernkurve |
Starke Online-Benutzergemeinschaft | Kann langsam sein |
Programmierbar mit mehr Funktionen zur Datenanalyse |
Zusätzliche Ressourcen:
- Leitfaden zur Einführung in die R-Bibliothek: In diesem von der University of Illinois Library veröffentlichten Leitfaden finden Sie wertvolle Übersichten und Tutorials.
- Quick-R von DataCamp: Diese Website bietet Tutorials und Syntaxbeispiele für eine ganze Reihe von Datenanalysefunktionen in R. Alles von der Installation des Pakets bis zu fortgeschrittenen Datenvisualisierungen.
- Learn R on Code Academy: Ein kostenloser Online-Kurs zum Selbststudium, um die Verwendung von R für Data Science und darüber hinaus zu erlernen.
- Nabble-Forum: Ein Forum, in dem Einzelpersonen spezifische Fragen zur Verwendung von R stellen und Antworten von der Benutzergemeinschaft erhalten können.
SPSS
SPSS ist ein IBM-Produkt, das für die quantitative Datenanalyse verwendet wird. Es verfügt nicht über eine Befehlszeilenfunktion, sondern hat eine Benutzeroberfläche, die vollständig durch Zeigen und Klicken bedient wird und ein wenig an Microsoft Excel erinnert. Obwohl es Excel sehr ähnlich sieht, kann es größere Datensätze schneller und einfacher verarbeiten. Einer der Hauptkritikpunkte an SPSS ist, dass es unerschwinglich teuer ist, da die einzelnen Pakete zwischen 1.290 und 8.540 Dollar pro Jahr kosten. Dafür, dass es so teuer ist, ist es unglaublich einfach zu erlernen. Als technisch nicht versierte Person habe ich mit Hilfe eines Online-Tutorials der University of Illinois Library in weniger als einer Stunde gelernt, wie man es benutzt. Meine Meinung zu dieser Software ist jedoch, dass man sich an Excel halten sollte, wenn man nicht wirklich ein leistungsfähigeres Werkzeug benötigt. Sie sind sich zu ähnlich, als dass es sich lohnen würde, diese spezielle Software zu verwenden.
Pros |
Cons |
---|---|
Schnell und einfach zu erlernen | Bei weitem das teuerste |
Kann große Datenmengen verarbeiten | begrenzte Funktionalität |
große Benutzeroberfläche | sehr ähnlich wie Excel |
zusätzliche Ressourcen:
- OpenLearn- Getting Started with SPSS: Ein kostenloser und offener Online-Kurs zum Erlernen der Verwendung von SPSS für die Datenanalyse.
- LinkedIn Learning: SPSS Statistics Essentials Training: Kostenloser Online-Kurs zum Erlernen der Grundlagen von SPSS.
- How to use SPSS: A step-by-step guide to analysis and interpretation von Brian Cronk: Dieses Buch ist ein Leitfaden für Anfänger zur Verwendung von SPSS für die Datenanalyse, der über die Scholarly Commons-Sammlung verfügbar ist.