この記事のポイント
- エビデンス = 統計学的に大部分の人に効果がある方法
- RCT = バイアスを排除して、調べたいファクターのみを比較できるようにした実験法
- メタ分析 = RCTを集めて分析した論文
このブログでは心理学や医学の論文を主に紹介しています。これらの学問分野と、物理や化学分野とでは、研究と一言で言っても、大きく違う点があります。
それは何でしょうか?
どういう視点で見るかによって、違いはかわってきますが、この記事では、研究対象に着目しました。つまり、心理学や医学は人を対象とした学問であるのに対し、物理や化学は物質や自然現象を対象とした学問であるということです。
この違いによって、同じ科学研究であっても、実験データの扱い方が変わってきています。ここでは、その違いについて、見ていきましょう。
目次
研究の方法
はじめに、物理学・化学と心理学・医学の実験手法の違いを見ていきます。物理学・化学、心理学・医学を例に出していますが、これら以外の学問も、基本的にどちらかのグループに分類されます。
物理学・化学の実験手法
物理学や化学では、実験室で機械や物質を使って実験をします。機械や物質は、同じ条件では必ず同じ動作・反応をします。物理学の実験で、もし同じ機械を使っているのに、日本とアメリカで異なる結果が出たのであれば、どちらかの機械が不調あるいは測定条件が一致していないということになります。
これは、物理学・化学が自然の摂理を解き明かす学問だからです。
難しい言葉を使いましたが、簡単にいうと、自然現象のルールを見つけるということです。自然現象は必ず一定のルールに則って発生します。そのルールで、まだ未解明の部分を研究によって明らかにしていきます。
私は化学の研究をしていましたが、化学でも同じです。
ある人が実験して(実験①)、新しい結果を見つけた場合、もう1回同じ実験をして(実験②)、同じ結果になるか確かめます。次に、同じ研究室の別の人が実験します(実験③)。実験①〜③で同じ結果になれば問題ありません。
しかし、往々にして、実験①と②、あるいは①・②と③で別の結果が出ることがあります。
その場合、疑われるのは、実験する人の技術的問題、実験に使用した器具へのゴミの付着、使用した試薬の純度、同じ反応・測定条件かといった点です。
個人の技術的な差が原因となることはありますが、個人の人柄や体質が問題になることはありません。(当たり前ですよね)
心理学・医学の実験手法
一方で、心理学や医学は、人を対象とした研究です。人は個人ごとにさまざまな違いがあります。性別、年齢、人柄、体格、体質、既往歴、人種・・・。数えたらキリがありません。
Aさん、Bさんだけを被験者として調べ、2人に当てはまったから、「〇〇は効果がある」とは言えません。何十人、何百人と試験をして、大部分の人に当てはまって、ようやく「〇〇は効果がある」と言えるようになります。
人を対象とした実験の場合、例えば薬を投与したことで病気が治ったのか、投与しなくても時間経過で治ったのかが、1人か2人を調べただけでは判断できないですよね。
研究する対象の違い
当たり前といえば当たり前ですが、実験手法の違いは研究対象の違いによるものです。
科学研究でもっとも大事なことの一つが再現性です。
いつの時代に、誰がどこで実験しても同じ結果になるものが科学研究であり、そういった内容が論文として発表されます。逆に言うと、再現性がないものは論文として発表できません。
統計処理で再現性を確認する
しかし、人を対象とした実験で、100人調べて、100人全員に当てはまる現象は、まずありえません。少なくとも1~2人、多ければ10~15人は当てはまらないでしょう。
ただ、この結果を再現性がない結果とすると、心理学などが全く発展しなくなってしまいます。
そこで、何人に当てはまれば再現性があるといえるか判断する方法が統計処理です。標準偏差、偏差値などは中学、高校で聞いた人も多いでしょう。これも統計学で出てくる用語です。
人を対象とした研究では、統計処理することで大部分の人に当てはまれば、再現性があるということになります。
エビデンスとは科学的に再現性があること
ここまでで見てきた「再現性」は研究で用いられることが多い言葉で、一般的には「エビデンス」という単語のほうが浸透しています。
厳密には、「再現性(reproducibility)」と「エビデンス(evidence)」は意味が全く違う単語です。
ただ、実験的に再現できる事象=科学的エビデンス(証拠)がある事象とも言えます。
心理学のように人を対象とした実験で再現性があるということは、あくまで統計上の話です。化学のように百発百中で再現できるというのとは、わけが違います。
心理学の場合、統計上の再現性なので、10人中8~9人にあてはまるくらいの割合ということになります。(8~9/10人はあくまで目安です。被験者の母数によって変わってきます。)
全員ではないけど、大部分の人に当てはまる実験結果であれば、エビデンスがあると言えるでしょう。
そして、エビデンスのある実験結果を得る実験手法がRCTと呼ばれる方法です。
RCT・メタアナリシスとは?
RCT(Randomized controlled test):ランダム化比較試験
RCTは、日本語ではランダム化比較試験のことです。調べる内容以外のバイアスを排除して調べたい事象のみを直接比較できるようにした実験法です。
はじめに、被験者を2つのグループに分けます。
グループ1:調べたい事象を含む(例:早起きする、ランニングする・・・)
グループ2:調べたい事象をしない(例:早起きしない、ランニングしない・・・)
グループ1,2で性別、人種、年齢などに偏りが出ないようにします。
例えば、グループ1は男女比が7:3で、グループ2は男女比が2:8の2つのグループでプロテインを飲んで筋トレしたときに筋肉がつきやすくなるかという調査をしたとします。この場合、グループ1は男性が多く、グループ2は女性が多いので、筋肉量や筋肉の付き方に差が出るのは当然です。
むしろ、グループ1,2の差が、プロテインの効果なのか、男女の性差なのかが判別できません。
こうなってしまっては、試験にならないので、グループ1,2では性別、年齢など(試験内容によっては性格)で差がつかないようにグループ分けをします。
被験者を2つ(ないしは3つ)のグループに分け、実験結果を比較し、調べたい事象に効果があるかどうかを調べる研究がRCTと呼ばれる実験手法です。
メタ分析:RCTの集合体
RCTは精度の高い方法ではありますが、1回だけRCTをしたから、その事象について答えが出たとは言い切れません。
多くのRCTは、ある大学の研究者が行うので、一般的にその大学がある国の人が被験者となります。RCTの場合、グループ1と2で差がないことが重要なので、被験者全員が同じ人種であれば、RCTの条件は満たします。
しかし、アメリカ人のRCTで出た結果が日本人にも当てはまるかというと、必ずしもそうではありません。特に医学のように、食事や体に関係することだと、アメリカ人のRCTと日本人のRCTで逆の結果になる可能性もあります。(逆になることは極めて稀ですが。)
ここでは人種の差を例にしましたが、実験では被験者の年齢層やバックグラウンドなどさまざまなファクターがあります。
そういったファクターの差も極力減らしていくのが、メタ分析(meta-analysis)と呼ばれるものです。簡単に言うと、RCTの集合体です。
あるテーマのRCTをいくつも集め、それぞれの論文の重要度、信頼性、被験者の人数などで傾斜をつけて、評価します。そして、テーマに関して「〇〇は効果がある」などの結論を出す手法がメタ分析です。
RCT単独でも比較的信頼性が高いエビデンスですが、それらを寄せ集めて結論を出すメタ分析は最も信頼性が高いエビデンスと言えます。
たまに、メタ分析の論文と一つのRCTの論文を比べている人がいますが、それらは比較できるものではありません。日本全体と1つの県を比べているようなもので、スケールが違います。
まとめ
心理学や医学などで使われる用語・実験手法のエビデンス、RCT、メタ分析について説明しました。なんとなくわかっていたことかもしれませんが、この機会に覚えておきましょう。
今の時代、ネットで数多くの情報が手に入りますが、情報の出処を調べるのは本人の責任です。信憑性・信頼性の高い情報とは何であるのか、自分で判断できるようになっていきましょう。