投稿

仮説を考える

前回、研究テーマをどう決めていくかを考えました。 今回はそこから進んで、実際に仮説を立てる過程を考えていきます。 私は、卒論で量的研究をしたのでこれ以降も量的研究をする前提で話を進めていきます。 研究テーマをなんとなく決めて、先行研究を進めていくと何かしらの仮説ができると思います。 この辺の流れは、言葉で説明するよりも実際にやっていると決まってくるものです。 仮説の難しさでいうと、どの程度のザックリ感で仮説を立てるのかということです。 社会学の研究だと、細かい部分は無視しても全体像を捉えにいったりします。 例)親子の年収には関連がある 社会心理学とか発達心理学だと、もう少し細かく見ていく印象があります。 例)グループワークでは、メンバーの向社会性が成果に影響を与える 認知心理学とかだと、もっと細かくて人間の記憶がどうとかって話になります。 これは良い例が思いつかないですが、系列位置効果などを想像していただくと分かりやすいかもしれません。 ノイズとなる要因の影響を限りなく統制する仮説となります。 だから、実験などが多くなりますね。 逆にザックリ全体像を追っていく社会学系は、国勢調査などのデータを元に追っていたりします。 仮説をどのくらいのザックリ感で立てるのかは、個人の裁量です。 といっても、指導教員の専攻や個性が出る部分だと思います。 それはゼミ選びの段階である程度見定められると良いですね。 自分と同じくらいのザックリ感で考えている指導教員の方がお互い幸せだと思います。 まぁ、そんなこんなで仮説を立てていきます。 突然適当な説明になりましたが、どんな仮説を立てるかは、研究者の個性が光る部分なのでここで詳しく書くことは不可能です。 ここでよりクリティカルだったりユニークな仮説を立てれらると、研究としてより価値が大きくなります。 仮説を考えては、友人やゼミ生・指導教員と話をして意見をもらいましょう。 何度もやっているとどんどんブラッシュアップされていくものです。 自分一人で悶々とやっていても、あまり前進しないと思うので積極的に他者と意見を交わすことが大切だと思います。 また、その時に”この研究・仮説はどこが新しいか、どこが面白いか?”と自問すると良いかもしれ

研究テーマを考える

卒論を始める時、まずは研究のテーマを決めないといけません。 研究者と言われる人の研究がどんな流れで始まるのかは、私は分かりません。 そのため、ここでは卒論レベルの話をしたいと思います。 はっきり言って卒論のテーマを決める際は、自分の興味関心が全てだと思います。 例えば、こんな感じ 例) 高校時代に友人関係で悩んだから、友人関係の研究 自分がメンヘラで、付き合う人もメンヘラばかりだからメンヘラの研究 自分が完璧主義だから、完璧主義の研究 ドラマを見てプロファイリングに興味を持ったから犯罪心理学の研究 読書が好きだから、読書体験の研究 例はすごい雑に書いているので漠然としていますが、実際の研究は進める過程でもっと細かいものになっていきます。例えば友人関係の研究をするとしたら、バランス理論を使ったりしながら友人関係におけるコンフリクトへの反応など細かく仮説としていきます。 でもそれは最終的な話で、研究の最初は自分の興味のあることを本や論文などを漁りまくってみることです。その中で自分が特に興味を持った部分を進めていくと「ここまでは分かってるけど、ここからはまだ分かっていないなぁ」なんて部分が見つかったり「この2つの理論や先行研究は矛盾しているように見えるけど、ここには他に〇〇も影響しているからこうなったんじゃないかな」なんてのがポツりポツりと出てきます。 その中で自分が特に関心のあることや「これが分かったら価値があるな」ということを研究するといいと思います。ここでの「価値がある」というのは、より核心的ことであったり研究の前提条件となっていることを再定義することだと思います。そんなに深く考えなくても、実際に誰もやっていないことなら、やる価値はあると思います。そして、それがよりユニークだったり新規性があると面白いねって言われるわけです。まぁ、そんな簡単に良い結果は出ないんですけどね。 そういえば昔、大学の教授が良い結果が出ないと学生が言った時に「そんなに簡単に結果が出たら、失業しちまうよ。こっちは何十年もやってんだから」とボヤいていたことを思い出します。 ちなみに、ここでは有意差が出たり関連が示されるような分析結果が出ることを便宜上”良い結果”と表現していますが、実際には差や関連がなかったということも研究の成

序章の序章〜なぜ序章を書くのか〜

このブログは卒論でRを使う学生がRでエラーが出まくって困らないように、そこそこ使えるようになれるようにと思って始めました。しかし、自分が実際に卒論を書く経験をしたり、同期や後輩から研究について相談を受ける中で強く感じことがあります。それは、Rは研究の一連の流れで分かりやすく躓きやすい部分ではありますが、研究の全体においては本当に部分的だということです。 実際に受ける相談の多くが、「どんな分析をすればいい?」というところから始まります。 つまり、やりたいこと(分析)は決まっているがRでどう実行したらいいか分からないのではなく どんな分析をするかなど、それ以前の部分で躓いている人が多いのです。 Rとは違って分析計画がなくてもエラーが出て進めないということもないため、躓いていることに本人が気がつかない事も多いものです。 そんな状態だといくらRの勉強をしても、卒論を完遂することができません。 そこで、Rで実際に分析する前段階がどのように進むのが良いか、またどんな準備をしておくと後々後悔しないかを書こうと思います。 しっかり準備をした状態で、分析の段階に入るとあとは本当にRを使いこなせるかどうかの問題です。 Rの使い方に関してもどんどん追記していきますが、まずはそれ以前の話を少ししておきたいと思います。卒論でそれなりに苦労した側の人間ですので、しくじり先生としてこのブログを読んだ方がしくじらないことを期待しています。 研究は全体の流れが大切ですがRが好きな私にとっては、Rで分析をする前の部分は序章といった感じです。笑  故に、序章として書かせていただきます。 初回は、『研究テーマを考える』です。 どうぞ気楽に読んでください。

日々思うことを少々 ー 閲覧数が1万を超えた

本ブログの閲覧数が1万を超えた!! 見て頂いた方々、このようなお見苦しいブログを閲覧いただきありがとうございます。 ブログを開始したのが、2017年12月7日だったのでほぼ1年で閲覧数1万ということだ。 これは一般的には全然すごくない、いやむしろショボいくらいなのだが個人的にはすごく嬉しい。 アクセス数の推移を見ると、ここ数ヶ月のアクセス数が特段に高い。 これは、恐らく後輩たちが卒論に追われている時期ということだろう。笑 私もこの時期には、必死になって卒論をやっていたことを思い出しなんだか懐かしい気持ちだ。 小学1年生の時から夏休みの宿題を最終日までやらない性格だった私なので、卒論でも無計画に最後に必死にやった。 朝9時から23時まで大学に缶詰で友人と一緒に、脳みそと愛用のMacをフル回転させて卒論を何とか乗り切った。 何だかんだ乗り越えられてしまうから、「何とかなる!」ということを学習してしまう。 頭では分かっていても身体が覚えることには抗えないから、つくづく人間だと思う。 そんなこんなの卒論だが、決して大変で辛かった思い出ではない。 卒論の時期には、Rが人より少しできたことで可愛い女の子から話しかけられることも多く、ユートピアにでも来たかと思った。 しかしそんなユートピアは極一時のことで、卒論が終わってしまえば波風一つ立たない日々がすぐに戻ってきた。 そうなることは分かっていても、可愛い女の子から「教えて!」と言われたら胸が高鳴ってしまうのだから、自分でも悲しくなる。 そんなことは置いておいても、卒論は大学最後の親交を深める機会としては良かったと思う。 私の周りの多くの人が追い込まれていたおかげで、共同体意識みたいなものが芽生えて一緒になって頑張れた。 もし一人でやっていたら、大学に缶詰になることも難しかっただろう。 お互いに触発し合うことができる環境に入られたことは何よりも良い体験だった。 その時に、交友関係や自分を取り巻く環境の重要性を痛感したものだ。 この経験は、社会人になってからの自分の環境や交友関係の作り方にも大きな影響を与えていると思う。 だから、卒論は辛くも楽しくも有意義でもあった経験だった。 と、綺麗に締めたもののやっぱり卒論で追い込まれ

大いなる反省を込めて

ブログ再開します!!! 最後にブログを更新してから、早6ヶ月が経った。 日々これ更新するつもりが、ちょっとしたブラック企業で働いていた影響もあり全く更新しないまま今日を迎えてしまった。 お仕事が忙しかったり、他にもやることに追われていたり、Rが必要な機会自体が減っていたこともありRとの距離も自然消滅寸前のカップルほど離れていた。 そんな折に、卒論で困った後輩から質問が来たり、呼び出されたりして久しぶりに研究やRに触れる機会があった。 その時に、思うことがいくつかあり再開を決断した次第 それが下記4点 ①ブログの内容が酷かった。 私自身、このブログを放置していたので久しぶりにブログを見た。 なかなか酷い内容だ。 私の頭の中をそのままメモした内容ばかりで、他の人が見て理解できる内容ではない。 これは、後輩に悪いことをした。 分からない人が分かるように書かないと意味がない。 ②意外と閲覧者がいた 初投稿が2017年12月で3月くらいまで精力的に(?)書いていたが閲覧者もほぼいなくやる気が減退した部分も大きかった。 しかし最近確認したところ、なんだかんだ現時点までで9368PVだった。 ここ最近が特に多い。卒論で困っている人が多いということだろうか。 見てくれる人がいるというのは、大変嬉しい事でやる気もグングンといった感じだ。 ③Rの使い方だけではダメだった 後輩の卒論の相談を聞いたときに、Rの使い方以前にどの分析をすればいいのかが分かっていない事に気がついた。 結局Rというツールの使い方が分かったところで、正しく使えなければ意味がない。 ④恩師がゼミでブログについて話していたらしい 我が恩師がゼミで「先生が卒業生の〇〇のブログを見れば分かるよ。」といった感じで名前を出して頂けたらしい... 名前を出されるなら、もっとまともな物にしないと恥ずかしい。 ⑤Rの使い方だけではダメだと思った このブログでは、大学生が卒論でRがそこそこ使えるようになることを目指したが、それだけではダメなようだ。 Rが苦手な人は多くの場合、どんな分析をすれば良いかなども分からないようだ。 結局どの分析を、Rでどうやるかはセットのようだ。 とい

無相関検定

イメージ
相関係数を先日紹介しましたが、無相関検定の事を書き忘れていました。 無相関係数の帰無仮説は「相関係数が0である」となります。 つまり、無相関検定で分かることは「相関関係があるかどうか」であって相関の強さの程度が分かるものではありません。 という事で、あまり個人的には使うことのない検定だと思います。 相関係数はt検定などと違い関係性の強さが分かる検定なので、相関関係があるかどうかよりもどの程度あるかが大切です。 無相関検定を使う時は、相関係数が小さく相関関係があると言えるかどうか微妙な時だと思います。 前置きが長くなりましたが、無相関検定の使い方は簡単です。 以下の通りです。 cor.test(変数1,変数2) 実際に使ってみると、下記図のようになります。 ここで言っている無相関検定はパーソンズの無相関検定なので、最初の行にそれが書いてあります。 最低限見るべきポイントは、 p-value:P値 cor:相関係数 今回の例では、0.01%水準で相関関係があると言えますね。 まぁ、相関係数が.998なので当然ですが。 ちなみに、RやExcelで2.2e-16はと表示された場合は、0.00000000000000022ということです。 eはエラーを意味していて、表示しきれない0が何個あるかという事を示しています。 2e5だったら、200000 2e-5だったら、0.00002を示しています。 無相関検定の厄介なところは、相関係数のように一気に算出できないことです。 1つひとつ算出しなければなりません。 しかし、for関数を使えばなんとかなりますが、それはいつか書こうと思います。

相関係数

イメージ
さて、今回は分析をやる際の基本である相関をやってみましょう。 相関は極めて簡単なので、サクッといってみましょう!! データは以前subsetの回でご紹介したデータを使ってみます。 これですね。 相関係数を出すのは、簡単です。 cor(変数1,変数2) 実際に、やってみるとこんな感じです。 相関メチャ高い!!! まぁ、擬似的に作ったデータなので当然なんですが... ちなみに、相関係数の大体の見方は下記の通りです。 .00~.20→ほとんど相関がない .20~.40→弱い相関がある .40~.70→比較的強い相関がある .70~1.0→強い相関がある 以上が基本の使い方になります。 しかし、このやり方では多数の変数の相関係数を一気に算出したい場合には手間がかかってしまします。 そんな時は、こうします。 これは、dataの3行目から8行目の変数の全ての組み合わせでの相関変数(相関行列)を出力してくれます。 これでたくさん変数があっても、一瞬で相関係数が分かりますね。 相関係数を算出するときに発生するエラーの大抵の原因は欠損値です。 欠損値があると相関係数が正常に算出されません。 そのために、欠損値の処理を置こうなオプションがcor関数にはあります。 代表的なものは、下記2点になります。 pairwise.obs・・・欠損値とペアになっているものだけを、使わない。ペアで欠損値の処理を行うので、最大限にデータを使える。 と、書きましたが自分でもうまく書けていないことがわかるので、もう少し丁寧に説明します。 相関係数のイメージは、下記図のようにx軸とy軸の値でプロットしていって計算します。欠損値があった場合pairwise.obsを使うとこのプロットの点が1つなくなる感じですね。 complete.obs・・・欠損のある行は使わない。 つまり、pairwise.obsよりもデータが大きく減ってしまうことがあります。na.omit関数に似ていますね。使い方を気をつけないと一気にデータ数が減ってしまいますね。 基本的には、pairwise.obs関数を使えば問題ないです。 使い方は以下の通りで、最後に引数として追加