母集団と標本を理解する
母集団と標本を理解する
データ収集の基本「母集団」と「標本」
ここでは統計によく出てくる「母集団」と「標本」の考え方を押さえておきましょう。
ある新聞社の内閣支持率調査の記事に次のような注意書きがあったとします。
「調査方法:平成○年×月9、10の両日、全国の有権者を対象に電話調査をした。対象者の選び方は無作為三段抽出法。有効回答は2056人、回答率は58%」となっていたとします。
ここで注目すべき点は「対象者の選び方は無作為三段抽出法」と「有効回答は2056人」の二点です。
この時点の日本全体の有権者数は約1億人です。本来は全員を調査しないと正しい調査結果とはいえません。
しかし、全員を調査するには、時間がかかり、費用もかかりますから不可能です。
そこで全体の中から代表者を選んで調査し、その結果から全体を推測する方法をとります。
この例ではその代表者数が2056人ということです。
全体の有権者を母集団といい、代表者2056人を標本といいます。
抽出という考え方をアタマに入れる
その新聞社の記事では「対象者の選び方は無作為三段抽出法」と標本の抽出法を説明しています。
それ以上の説明はありませんが、たぶん住民基本台帳から、
@町村名を名前順に並べて100からひとつ選び出す第一段目の抽出、
A第二段目ではその町村の住民の中から10世帯に1世帯抽出し、
B第三段目は世帯の中から1人抽出する、というようにされていると思います。
なるべく母集団全体の中から偏りが出ないように抽出します。
ここで気になるのが、2056人という人数です。
この数から全体を推計して出した内閣支持率は、統計理論からは2000人で十分であると証明されています。
細かい分析、たとえば地域別とか、年代別の内閣支持率などの分析をするなら調査対象者を増やさなくてはなりません。
全数の調査は、実行しようとしてもできない場合もあります。
野生動物の調査や、ビールやお米など生産される製品の全数品質調査などを完全に実行するのは不可能です。
そこで全体の中からいくつかの標本を取り出して検査し、全体を推測します。
母集団と標本を理解する 関連ページ
- 日常生活における統計的思考
- 経験の理解
- 統計とは何だろう
- 記述統計と推測統計
- 標本の収集(サンプリング)
- 収集された標本の記述
- 統計的変量
- 統計的変量2
- 誤差・精度・測定値
- データのまとめ方
- 時系列
- 中央値
- 平均値
- ばらつき
- 分布の形状
- 歪み
- a
- a
- a
- a
- a
- a
- a
- a
- 統計は「どんな人」でも使える
- 「どんなとき」に使うかを理解する
- 統計で会社や製品への信頼感が増す
- 「どんなメリット」があるかを押さえる
- 統計は万能ではなく、限界もある
- データ収集にはいろいろな手段がある
- データは2種類に分類できる
- データの形式で手法にちがいがある
- データを処理する手順を知る
- 見やすい階級をつけて集計する
- グラフをつくりその特性を読み取る
- ソルバーの威力
- 相乗平均
- ビッグデータ
- オープンデータ
- データマイニング