医療統計学:データを処理する手順を知る

統計学セミナー

医療統計学:データを処理する手順を知る

 

                    医療統計学、医療経済学、数学のつぼをたとえ話でわかりやすく解説

 

                    運営者の20年以上にわたる医療統計学のノウハウを満載

 

データを処理する手順を知る

 

組み合わせがない数量データのケースは、並び替えをし、異常値を処理する

 

さて、いよいよデータの処理に取り組みます。

 

組み合わせがない数量データを見やすくする処理です。

 

最初の作業は、「データの並び替え」をしてみましょう。大きい順か小さい順に並び替えて見ます。

 

なぜ最初に並び替えをするかといいますと、大きく二つの目的があります。

 

ひとつ目の目的はデータ全体の範囲をつかみ、次の階級をつける作業の準備です。

 

二つ目の目的は、大きく外れたデータ(異常値という)があるかどうかを見極めることです。

 

今ここに、例題として男子大学生の身長に関する調査データがあります。

 

これを小さな順に並び替えをします。表計算ソフトを使うと簡単に並び替えをしてくれます。

 

その結果、次のことがわかります。

 

@データは156から184の範囲にある。

 

A外れた値のデータはなさそうである。

 

さらに最小値は156、最大値は184です。さらにもうひとつ中央値という特性がわかります。

 

中央値とは順番に並べた真ん中の値のことをいいます。

 

データの数が奇数個ですと真ん中の数にあたりますが、データの数が偶数個のときは真ん中の二つのデータの平均になります。

 

真ん中の二つの値がともに同じなら、その値が中央値となります。

 

 

異常値の処理を考える

 

異常値とは、飛び離れた値をとるデータです。

 

事実として離れているデータであるならそれは大きな情報となります。

 

しかし、測定ミスや、入力ミス、他のデータが混入したケース、データの桁をまちがえたケースなどがあります。

 

それを正しいデータとして統計処置するとまったくまちがった結果になります。

 

明らかにミスの場合は除外しますが、異常値かどうかを判断するにはむずかしいケースに出会います。

 

そのときは、二つの方法が用意されています。

 

ひとつは統計的に判断する方法です。もうひとつは、並べた数値の上部5%と下部5%のデータをカットしてしまう方法です。
これはトリム平均といわれています。

 

もっと勉強したい方は⇒統計学入門セミナー

 

統計学セミナー

医療統計学は、自己学習ではどうしても時間がかかってしまい効率悪くなりがちです。本セミナー受講により、医療統計学の理論だけでなく実際の作業をどう進めるかなど、具体的な方法を伝授します。これにより、医療統計学の理解が倍増すること間違いなし!この機会にぜひご活用ください。



HOME プロフィール 統計セミナー 出張相談サービス お問い合わせ