医療統計学:歪み

統計学セミナー

医療統計学:歪み

 

                    医療統計学、医療経済学、数学のつぼをたとえ話でわかりやすく解説

 

                    運営者の20年以上にわたる医療統計学のノウハウを満載

 

歪み

 

歪むとは観測値が長い裾を持つことに等しいです。

 

分布は正負どちらに歪むこともありえます。

 

もし歪み(裾)が右側(正の方向)であるならば正に歪んでおり、その左側ならば負に歪んでいるといわれます。

 

それでは、図の分布はどちらが正に、どちらが負に歪んでいるでしょうか。

 

分布(1)は正に歪んでおり、(2)は負に歪んでいます。

 

(1)では長い裾が右側にあり、(2)では左側にあるからです。

 

この二つの分布においては、その最大と最小の観測値はほぼ等しいですが、平均は大きく異なります。

 

(1)では平均は17.1点で、(2)においては30.2点です。

 

歪みが、平均、メディアン、モードの相対的な大きさと位置関係にもたらす影響は特に注意すべきです。

 

これまでのような対称な分布においては、中心化の傾向の三つの尺度は、すべて同一の場所、すなわち分布の中心にありました。

 

たとえば、以下図のような簡単な点図を見てみましょう。

 

 

図は、1に1個、2に2個、3に1個の観測値があることを表しています。

 

モードは、最も頻度の高い観測値であることを思い出せば2となります。

 

同様にメディアンは、分布をそれより大きいものと小さいものに二等分する値ですから、

 

やはり2となります。そして平均は、観測値の総和をそれらの間に等しく分け与えたとすれば、

 

(1+2+2+3)/4 と計算され、やはり2となります。

 

それでは、右端に2個の観測値を加え、裾を作り、簡単な分布を歪めた場合、どのようになるか見てみましょう。

 

4と5という観測値を1個ずつ加えることにします。

 

これらが三種の平均にどのような影響を与えるでしょうか。

 

まず、最も頻繁に観測される値は依然として2です。それゆえ、モードはこのまま変化しません。

 

しかし、メディアンはどうでしょうか。

 

今度は分布に6個の観測値(4個ではなく)があるので、メディアンは3番目と4番目の値の真ん中になければなりません。

 

3番目の観測値は2で、4番目の観測値は3です。

 

よって、メディアンは2.5となります。

 

このことから、メディアンはモードから離れ、歪みの方向へと引き離されたことがわかります。

 

それでは、平均はどうでしょうか。

 

分布が歪んでいる場合、それは他の二つの平均とどのような関係に位置するでしょうか。

 

 

平均は歪みの方向へさらに大きく引っ張られます。なぜならば、それは何個の観測値が新しく加わったかということだけでなく、

 

それらの大きさによっても影響を受けるからです。

 

実際、新しい分布の平均は、

 

(1+2+2+3+4+5)/6 = 17/6 = 2.8

 

となります。それゆえ、歪んだ分布においては、三つの平均の位置は図のようになります。

 

そして、分布の裾が反対側にあるならば、この位置関係はちょうどひっくり返ります。

 

歪んだ分布においては、三つの平均の相対的な位置関係は、常に予想しうるものです。

 

モードは分布のピークの下にあり、平均は歪みの方向(左右どちらにでも)に引っ張られていて、

 

メディアンはモードと平均の間にあります。

 

歪みが大きいほど、モードと平均の間の距離も大きくなります。

 

歪みの大きさを記述する尺度として、歪度(わいど)と呼ばれる統計量があります。

 

あまり使われていないのでここでは省略します。

 

さて、ここでもう一度二つの点数の分布を見てみましょう。

 

今度は、三つの平均がそれぞれどこにあるかを矢印で示してみました。

 

歪みに関する皆さんの理解度をテストするため、それぞれの破線(点線)の上に三つの平均の名前を鉛筆で記入してみましょう。

 

 

分布(1)においては、左から右へモード、メディアン、平均、分布(2)においては、平均、メディアン、モードとなります。

 

ところで、これらの二つの試験における二種類の歪みに関しては、その原因を説明することができます。

 

分布(1)はレッスンを始めた直後の数学の試験の点数を表していて、(2)はそのコースの最後に行われた試験での点数を

 

あらわしています。数人の学生はレッスンの効果が上がらず、依然として低い点数にとどまっていますが、明らかに大部分はかな

 

りよい点数を取るようになりました。

 

それでは、ヒストグラムに戻ってみて、分布(2)におけるばらつきは分布(1)と比べて増加したでしょうか。減少したでしょうか。

 

あるいはほぼ変化なしでしょうか。

 

 

実際のところ、明白な相違はほとんどありません。しかしながらよく見ると、分布(2)のばらつきは、分布(1)におけるよりもやや

 

小さいように思われます。(2)の方のレンジが少し小さく、背の高い三本の柱も(1)に比べ

 

 

もっと勉強したい方は⇒統計学入門セミナー

 

統計学セミナー

医療統計学は、自己学習ではどうしても時間がかかってしまい効率悪くなりがちです。本セミナー受講により、医療統計学の理論だけでなく実際の作業をどう進めるかなど、具体的な方法を伝授します。これにより、医療統計学の理解が倍増すること間違いなし!この機会にぜひご活用ください。



HOME プロフィール 統計セミナー 出張相談サービス お問い合わせ