大量のデータで研究をしていると、Excelでデータ分析をするのを卒業して、より強力なソフトウェアを見つけることが必要になってきました。 特に、これまで大きなデータを分析しようとしたことがない場合は、本当に大変な作業に思えるかもしれません。 世の中には数多くのデータ分析ソフトウェアがありますが、どれが自分の研究に最適なのか、必ずしも明らかではありません。 研究データの性質、技術的な専門知識、そして個人の好みなどが、どのソフトウェアが最適なのかに関わってくるのです。 この記事では、定量データ分析に関する Stata、R、SPSS の長所と短所を説明し、その他のリソースへのリンクを提供します。 この投稿でお話しするすべてのデータ分析ソフトウェアは、イリノイ大学の学生、教員、スタッフが Scholarly Commons コンピューターを通じて利用でき、特定の質問がある場合は、CITL でコンサルテーションを予約することができます。 Stataは、社会科学、特に経済学と政治学で人気があります。 これは、完全な統合統計ソフトウェアパッケージであり、視覚化を含め、必要な統計的タスクのほとんどを達成できることを意味します。 ポイント・アンド・クリックのユーザー・インターフェースと、習得しやすいコマンド・シンタックスを持つコマンド・ライン機能の両方を備えています。 さらに、バージョン管理システムを備えているため、特定の作業で使用した構文を「doファイル」に保存して、後で参照することができます。 Stataは個人のコンピュータに無料で入れることができるわけではありません。 オープンソースのプログラムとは異なり、Stataに独自の関数をプログラムすることはできないので、すでにサポートされている関数に限定されます。 また、数値データ、カテゴリデータに限定されており、空間データ、その他特定のデータは分析できません。
Pros |
|
---|---|
ユーザーフレンドリー、学びやすい | 個人ライセンスのコストは年間 125ドルから425ドル |
バージョン管理 | 特定のデータタイプに限定される |
学習のための多くの無料オンラインリソース | Stataに新しい 関数をプログラムできない |
付加的なリソース。
- STATA YouTube Channel:
- Alan C. Acock著「A Gentle Introduction to STATA」:Stataのトラブルシューティングのための素晴らしいリソース。
- Stata.com Resources for learning STATA: Stataで特定の関数を実行する方法についての情報がたくさんあります。
- The University Library’s Guide on STATA: Stataに関する追加リソースへのリンクを見つけるのに最適な場所。
R
R とそのグラフィカルユーザーインターフェースのコンパニオン R Studio は多くの理由で非常に人気のあるソフトウェアである。 まず、おそらく最も重要なことは、どのオペレーティング システムとも互換性のある、無料のオープンソース ソフトウェアであるということです。 そのため、ユーザーの強力で忠実なコミュニティが存在し、彼らの仕事やアドバイスをオンラインで共有しています。 ポイント&クリックのユーザーインターフェース、コマンドライン、保存可能なファイル、強力なデータ分析および可視化機能など、Stataと同じ機能を備えています。 また、より専門的な知識を持つユーザーは、Rで新しい関数をプログラミングして、さまざまな種類のデータやプロジェクトに使用できるため、Stataにはない機能も備えています。 Rの問題点は、習得が容易でないことです。 Rのプログラミング言語は直感的でなく、エラーが発生しやすい。 このように学習曲線は急ですが、Rを学ぶための無料のオンラインリソースが豊富にあります。
Pros |
|
---|---|
Free open->
ProsCons |
Steep learning curve |
Strong online user community | Can be slow |
Programable with more functions for data analysis |
Addlementary Resources.This case is the other resources:
- Rライブラリガイド入門。
- Quick-R by DataCamp: イリノイ大学図書館が出版したこのガイドで、貴重な概要やチュートリアルを見つけることができます。 パッケージのインストールから高度なデータの可視化まで、すべて。
- Learn R on Code Academy:Rのデータ分析関数のホストに対するチュートリアルとシンタックスの例を提供するウェブサイト。
- Nabble forum: Rをデータサイエンスとそれ以外に使用することを学ぶための、無料の自習用オンラインクラス。
- Nabble forum: Rの使用に関する特定の質問をし、ユーザーコミュニティから回答を得ることができるフォーラム。
SPSS
SPSS は定量データ分析に使用する IBM 製品です。 コマンドライン機能はなく、完全にポイント アンド クリックのユーザー インターフェイスで、Microsoft Excel に多少似ています。 見た目はExcelによく似ていますが、より大きなデータセットをより速く、より簡単に処理することができます。 SPSSの主な不満の1つは、それが使用するために法外に高価であることであり、個々のパッケージは、年間1,290ドルから8,540ドルである。 SPSSは、その高価さを補うために、驚くほど簡単に学ぶことができます。 技術者でない私は、イリノイ大学図書館のオンラインチュートリアルに沿って、1時間以内に使い方を学びました。 しかし、このソフトウェアに関する私の見解は、より強力なツールが本当に必要でない限り、Excelに固執することです。 このような専門的なソフトウェアを求めるには、両者はあまりにも似すぎています。
Pros |
|
---|---|
Quick and easy to learn | By the far most expensive |
Can’t be used by the most expensive. 大量のデータを扱う | Limited functions |
Great user interface | Very similar to Excel |
Additional Resources:
- OpenLearn- Getting Started with SPSS: データ分析に SPSS を使用することを学ぶための無料かつオープンなオンライン クラスです。
- LinkedIn Learning: SPSS Statistics Essentials Training。 SPSSの基礎を学ぶための無料のオンラインクラス。
- How to use SPSS: A step-by-step guide to analysis and interpretation by Brian Cronk: この本は、Scholarly Commonsコレクションで利用できるデータ分析のためにSPSSを使うための初心者のためのガイドです。
。