A mesure que vous effectuez des recherches avec de plus grandes quantités de données, il devient nécessaire de passer le diplôme de faire votre analyse de données dans Excel et de trouver un logiciel plus puissant. Cela peut sembler une tâche vraiment décourageante, surtout si vous n’avez jamais essayé d’analyser de grandes données auparavant. Il existe un certain nombre de logiciels d’analyse de données, mais il n’est pas toujours évident de savoir lequel fonctionnera le mieux pour votre recherche. La nature de vos données de recherche, votre expertise technologique et vos préférences personnelles sont autant d’éléments qui vont jouer un rôle dans le choix du logiciel qui vous conviendra le mieux. Dans cet article, j’expliquerai les avantages et les inconvénients de Stata, R et SPSS en ce qui concerne l’analyse des données quantitatives et fournirai des liens vers des ressources supplémentaires. Chaque logiciel d’analyse de données dont je parle dans ce post est disponible pour les étudiants, les professeurs et le personnel de l’Université de l’Illinois par le biais des ordinateurs Scholarly Commons et vous pouvez programmer une consultation avec le CITL si vous avez des questions spécifiques.
Rockez votre recherche avec les bons outils !
Parmi les chercheurs, Stata est souvent crédité comme le logiciel d’analyse de données le plus convivial. Stata est populaire dans les sciences sociales, en particulier l’économie et les sciences politiques. C’est un progiciel statistique complet et intégré, ce qui signifie qu’il peut accomplir à peu près toutes les tâches statistiques dont vous avez besoin, y compris les visualisations. Il possède à la fois une interface utilisateur de type « pointer-cliquer » et une fonction de ligne de commande avec une syntaxe de commande facile à apprendre. De plus, il dispose d’un système de contrôle de version, ce qui vous permet de sauvegarder la syntaxe de certaines tâches dans un « do-file » auquel vous pourrez vous référer ultérieurement. Stata n’est pas gratuit sur votre ordinateur personnel. Contrairement à un programme open-source, vous ne pouvez pas programmer vos propres fonctions dans Stata, vous êtes donc limité aux fonctions qu’il supporte déjà. Enfin, ses fonctions sont limitées aux données numériques ou catégorielles, il ne peut pas analyser les données spatiales et certains autres types.
Pros |
Cons |
---|---|
Facile à utiliser et à apprendre | Une licence individuelle peut coûter entre 125 et 425 dollars par an |
Contrôle de version | Limité à certains types de données |
De nombreuses ressources en ligne gratuites pour l’apprentissage | Vous ne pouvez pas programmer de nouvelles fonctions dans Stata |
Ressources supplémentaires :
- Chaîne YouTube de STATA : Une excellente ressource pour le dépannage des problèmes dans Stata.
- Une introduction douce à STATA par Alan C. Acock : Une grande référence pour commencer avec Stata disponible dans la collection Scholarly Commons.
- Ressources de Stata.com pour apprendre STATA : Beaucoup d’informations sur la façon d’exécuter des fonctions spécifiques dans Stata.
- Guide de la bibliothèque universitaire sur STATA : Un excellent endroit pour trouver des liens vers des ressources supplémentaires sur Stata.
R
R et son compagnon d’interface utilisateur graphique R Studio sont des logiciels incroyablement populaires pour un certain nombre de raisons. La première et probablement la plus importante est qu’il s’agit d’un logiciel libre et gratuit, compatible avec n’importe quel système d’exploitation. En tant que tel, il existe une communauté forte et fidèle d’utilisateurs qui partagent leur travail et leurs conseils en ligne. Il possède les mêmes caractéristiques que Stata, telles qu’une interface utilisateur de type pointer-cliquer, une ligne de commande, des fichiers enregistrables et de solides capacités d’analyse et de visualisation des données. Il possède également certaines capacités que Stata n’a pas, car les utilisateurs ayant une plus grande expertise technique peuvent programmer de nouvelles fonctions avec R afin de l’utiliser pour différents types de données et de projets. Le problème que rencontrent beaucoup de personnes avec R est qu’il n’est pas facile à apprendre. Le langage de programmation sur lequel il fonctionne n’est pas intuitif et il est sujet à des erreurs. Malgré cette courbe d’apprentissage abrupte, il existe une abondance de ressources en ligne gratuites pour apprendre R.
Pros |
Cons |
|
---|---|---|
Logiciels libres et gratuits | .source libre | Vieille courbe d’apprentissage |
Forte communauté d’utilisateurs en ligne | Peut être lent | |
Programmable avec plus de fonctions pour l’analyse des données |
Ressources supplémentaires :
- Guide d’introduction à la bibliothèque R : Trouvez des aperçus et des tutoriels précieux sur ce guide publié par la bibliothèque de l’Université de l’Illinois.
- Quick-R par DataCamp : Ce site Web propose des tutoriels et des exemples de syntaxe pour toute une série de fonctions d’analyse de données dans R. Tout, de l’installation du paquet aux visualisations de données avancées.
- Apprendre R sur Code Academy : Un cours en ligne gratuit et autodidacte pour apprendre à utiliser R pour la science des données et au-delà.
- Forum Nabble : Un forum où les individus peuvent poser des questions spécifiques sur l’utilisation de R et obtenir des réponses de la communauté des utilisateurs.
SPSS
SPSS est un produit IBM qui est utilisé pour l’analyse quantitative des données. Il ne dispose pas d’une fonctionnalité de ligne de commande mais plutôt d’une interface utilisateur entièrement de type pointer-cliquer et qui ressemble quelque peu à Microsoft Excel. Bien qu’il ressemble beaucoup à Excel, il peut traiter des ensembles de données plus importants plus rapidement et avec plus de facilité. L’une des principales plaintes concernant SPSS est que son coût d’utilisation est prohibitif, avec des forfaits individuels allant de 1 290 à 8 540 dollars par an. Pour compenser son coût, il est incroyablement facile à apprendre. En tant que personne non technique, j’ai appris à l’utiliser en moins d’une heure en suivant un tutoriel en ligne de la bibliothèque de l’Université de l’Illinois. Toutefois, à moins que vous n’ayez vraiment besoin d’un outil plus puissant, je vous conseille de vous en tenir à Excel. Ils sont trop similaires pour justifier la recherche de ce logiciel spécialisé.
Pros |
Cons |
---|---|
Vite et facile à apprendre | De loin le plus cher |
Peut traiter de grandes quantités de données | Fonctionnalité limitée |
Grande interface utilisateur | Très similaire à Excel |
Ressources supplémentaires :
- OpenLearn- Getting Started with SPSS : un cours en ligne gratuit et ouvert pour apprendre à utiliser SPSS pour l’analyse de données.
- LinkedIn Learning : Formation SPSS Statistics Essentials : Classe en ligne gratuite pour apprendre les bases de SPSS.
- How to use SPSS : A step-by-step guide to analysis and interpretation by Brian Cronk : Ce livre est un guide pour débutants sur l’utilisation de SPSS pour l’analyse de données disponible dans la collection Scholarly Commons.
.