▼▼▼▼▼▼▼▼ ▼▼▼▼▼▼▼▼
お問合せはこちら セミナー詳細こちら
医療統計学:t検定の誤用
医療統計学、医療経済学、数学のつぼをたとえ話でわかりやすく解説
運営者の20年以上にわたる医療統計学のノウハウを満載
t検定の誤用
同一集団を対象にして、2つの性格特性(AとB)について7段階評定を行い、対応のあるt検定で検定して良いでしょうか?
この質問は統計法の利用においてしばしばなされる誤用の例です。
ではなぜ誤用なのでしょうか。その説明の前に、心理測定法の原理について簡単に解説します。
心理測定法の原理
一般に心理学の実験(調査)では、研究対象である心理現象を直接的に測定することはできません。
心理現象は目に見えない現象であり、それを直接的に測る物差し(尺度)を構成することはできないのです。
このため、客観的に観察することのできる何らかの物理量(正反応数、エラー数、反応時間など)を測定することによって、間接的に心理量の測定がなされます(物理量の尺度を表面尺度、心理量の尺度を元型尺度とよびます)。
この質問の場合であれば、評定値が物理量、性格特性が心理量ということになります。
異なる尺度上の値の比較は無意味か?
質問の例がなぜ誤用なのかを説明します。
それは、AとBの評定値は、それぞれ、性格特定Aと性格特性Bという心理量に対応する異なる表面尺度上の測定値だと考えるべきだからです。
この質問の場合のt検定は、同一尺度上の平均値の差を検定する方法なので、異なる尺度上の平均値の差を検定することはできません。
このことは、平均身長と平均体重の差を検定するのが無意味であることを考えてみれば明らかでしょう。
これと全く同様に、たとえば英語、国語、数学という3教科の試験における平均値の差を分散分析によって検定することは無意味です。
なぜなら、仮に3教科とも70点をとった生徒がいたとしても、その生徒の3教科の学力が同じレベルである(同じ程度に得意である)ということを意味するわけではないからです。
同じ70点でも、平均値や標準偏差が異なれば、得点の意味も異なります。
ですから、試験が標準学力テストで、しかも成績が偏差値で表されているのでない限り、3教科の平均値の差を検定することは無意味なのです。
ではなぜ、質問の例のような誤用がしばしばなされるのでしょうか。
おそらくAとBの性格特性の評定値は、いずれも7段階尺度で表示されるので、共通の尺度だと誤解されやすいのではないでしょうか。
しかし、表面尺度が同じだからといって、元型尺度も同じであるとは限りません。
三段跳びと砲丸投げの記録は、どちらも長さという共通の尺度で表されますが、跳躍力と投てき力という異なる元型尺度上の能力を測っているのです。
もっと勉強したい方は⇒統計学入門セミナー