医療統計学:データのばらつき



データのばらつき

 

データのばらつき

 

データのばらつきについて考えてみましょう。

 

             

 

A社とB社の給料は、ばらつきの程度が違うにもかかわらず、平均、メディアン、モードの代表値はすべて一致しました。

 

では、これらの違いをうまく表現する、言い換えればばらつき具合を表現するにはどうすればよいでしょうか。

 

おそらくデータの範囲に着目するやり方が、最も簡単と考えられます。

 

つまり、データの最大値から最小値を引いたものです。

 

この値は「レンジ」と呼ばれ、ばらつきの尺度としては最も粗いが簡単なものです。

 

上の例でそれぞれレンジを求めると、

 

A社の場合 30−3−=0 (レンジがないので、ばらつきもない)

 

B社の場合 50−10=40 (レンジが大きいので、ばらつきも大きい)

 

となり、ばらつきの様子がそれなりに分かるわけです。

 

しかし、実際には、このレンジはあまり使われません。

 

理由は、単に最大値、最小値のみによるので、データの中に異常ともいえる極端に大きい(あるいは小さい)値が、たったひとつでもまぎれこんでいると、レンジがこの異常値に左右されてしまうからです。

 

したがって、レンジでない別のばらつきの尺度を考える必要があります。



HOME プロフィール お問い合わせ