これからRをはじめるあなたに


最近の分析ツールのトレンドは、SPSSからRに移行しているらしいです。
その理由は、以下の4点らしいです。


1.無料
SPSSはビックリするくらい高いらしく(学割を使えばそこそこ)、自分で購入するにはハードルが高いため分析のためだけに大学に行かなければならない事態になります。


2.パッケージが豊富
無料のソフトなので、世界中のオタクたちが日々新しいパッケージを作成しています。SPSSの様にどこかの企業が管理している訳ではないので、同時並行で世界中の人が開発に参加できるという利点があります。最新の分析方法に関してもどんどんパッケージが作られている様です。また、anova kunの様にパッケージとは違う形でもツールが無料で提供されていることが多いので、便利です。


3.分析の内容を理解していないと使えない
これは、Rを最初に授業で教授に教わった時に言われたことです。SPSSはボタンをポチポチ押しているとなんだか知らないけど、分析結果が出力されます。分析の内容は理解していなくても、結果が出てしまうのでその分析が間違っていても気がつかないことがあるそうです。Rは気難しくすぐにエラーを返してきますが、それはこちら側のコードが間違っていることが原因です。適当にやっていてはRでは分析ができないので、Rの方が勉強になるらしいです。
SPSSを使ったことがないので、どれだけ差があるかは分かりませんが、Rの方が慣れるまでに苦労するのは確実ですね。最近、私は無駄にR慣れしてしまったので、なんとなく結果を出力できるようになってしまい、後から分析を学ぶという自体もちょくちょく...


4.拡張性がある
Rは1種のプログラミングなので、同じ作業をさせる場合にはそのコードを組んでやれば1回の実行で大量の結果を出すことができます。以前間違えて分散分析を500回連続でやらしてしまい、私のパソコンが死にそうになったこともあります。コード次第では、質問紙の全項目に関して男女でt検定を行うなんてこともできます。そんなことができるとRが可愛く見えてきますね。

そんなこんなで、これから分析ツールはどんどんRになっていくようです。

そんなRですが、多くの人が最初にいろいろと躓いてRが嫌になる、量的研究に苦手意識を持つことになるみたいです(私も統計学に関しては苦手意識を持っていますが)。
そこで、R初学者が具体的にどの辺で躓くか、どのようにRと向き合っていけば心折れずにいられるかという話を今回は書きたいと思います(前置きが長い...)。


まず、Rには癖があります。具体的に説明するのが難しい感覚的なものですが、何というか、R独特のルールがあります。
そのR内での何となくのルールが肌で分かってくると意外にもスイスイと使えるものです。
また、R内のルールが分かってくると、インターネットでのR情報が理解できるようになります。極端な話をすると、説明文がなくてもコードを見れば何となく何をやっているかが見えてきます。

ルールの例としては、<- や $ があります。代入とどのデータセットで何をいじっているということが分かるだけで、相当理解が進みます。
このRの癖を理解するためには、Rをいろいろといじってみるしかないと思います。
でも、ただいじるだけではなく「自分が今Rにどんな命令を出しているのか」と「今、Rの中はどうなっているのか」という2つを意識するといいと思います。

「自分が今Rにどんな命令を出しているのか」


これは、自分のコードの意味を理解しながらやるということです。とりあえず、コードを書き写しているだけでは理解できません。t検定をやる際には、自分がどの変数で2群に分けて、どの変数の平均の差を見るのかということを明確に意識しなければならないと思います。




「今、Rの中はどうなっているのか」


自分がどんなデータセットを作ったのか、必要な変数はどのデータセットに入っているのか、そういうことを意識していると混乱しなくて済みます。


新しい変数を作ったり、新しいオブジェクトに何かを代入する際には「自分は新しいものを作って、今Rの中はどうなっているぞ」というのを意識しましょう。R studioを使うと右上にオブジェクト一覧が出るので理解しやすいと思います。

そして、R最大の敵がエラーです。

しかもRのエラーは大抵の場合、英語で表示されます。私も英語はダメな人間なのでこれには苦労しました。


Rのエラーと戦う方法は3つあります。


1つ目はエラー表示された英文を翻訳することです。私はエラーをコピーしてGoogle翻訳にかけたり、統計用語などは単語で検索してRが何と言っているかを何となく理解していました。


2つ目はエラー表示された英文をコピぺしてそのまま検索してみることです。大抵のエラーはすでに誰かがネットで質問したり、解説したりしています。エラー文でそのまま検索すると大抵ヒットします。そうすれば大抵のエラーは解決します。検索した際に、使えそうなサイトを見つけたらすぐにブックマークしておきましょう。有効な情報源をいくつ持っているかというのが、自分のR力に大きく影響してきます(私のブログもブックマークされるようになりたい!!)。
Rだけではありませんが、検索力というのは大きな力です。
インターネットの発達のおかげで現代社会には情報があふれています。その溢れる情報の中から自分に必要な情報を的確に探す能力は顕著に重要な能力です。

Rのエラーと格闘していると、自然とエラーが何を言いたいのかというのが分かるものです。英語がサッパリピーマンの私でも、Rのエラーは大抵何を言っているのか分かるようになりました。というか、分析やその前のコードを見ればどの辺でエラーが出そうかというのの検討がつきます。
最後の1つを書き忘れていました。Rのエラーと戦う最後の方法はRに詳しい人に聞くことです。一番単純で一番効率がいいです。卒論シーズンには、普段はあまり話さない子からもエラー表示されたRの写メが送られてきたものです...。それをきっかけに仲良くなれた人もいるので、今思えばよかった気もします。検索するより直接答えが返ってくるのでいいですね。問題点としては、相手が忙しいと解決が遅くなりますし、その人でも分からない問題は解決しないということです。
(このブログでも、コメントや連絡フォームで聞いていただければ可能な限り返答するつもりです。)


そして、エラーが出て誰かに助けを求める時の注意点があります。
それは、エラー文だけを見せないということです。写メでエラー文だけを見せられてもその原因は簡単には分かりません。

その前のコードが重要です。どのようなコード進行できて、このエラーが出たのかということが分からないと、Rに詳しい人でも原因が分かりません。

聞く側の礼儀として、必要な情報はしっかりと送りましょう。


Rに慣れるまでに気をつけることはこんな感じです。

何事も最初に挑戦するときは、感覚を掴むまでに時間がかかるものです。

大抵の人はそこでいやになってやめてしまいますが、少し我慢してやっていれば気がつかぬうちにできるようになっているものです。


卒論でRを使う必要があるなら、少しは頑張った方がいいでしょう。

コメント

このブログの人気の投稿

Googleフォームの使い方(基本編)

Rでの、データの基礎統計量の算出(summary,describe)

subsetで必要なデータだけを、取り出す。

Googleフォーム使い方(応用編) 回答に応じて分岐、セッションの移動

Googleフォームの使い方(応用編) 設定の使い方