データは2種類に分類できる
データは2種類に分類できる
数量データとカテゴリーデータ。種類によって統計手法がちがう
データには種類があります。データが測れるか、測れないかの二種類に分類されます。
それぞれ数量データとカテゴリーデータと呼ばれています。
数量データは、たとえば人間の身長のデータのように、165.3cm、170.5cmなどの値で計測できます。
実社会では、たとえば気温・湿度など、数え切れないほどの数量データに出会います。
これらは、社会の事実は実績を表現しています。社会活動の結果を分析することは重要なことですので、統計的処理の発展は、数量データを統計的に処理することから理論化されてきています。
数量データは測るメジャーがあり、その刻みは等間隔になっています。
測れないデータの特性をつかむ
一方、測れないデータをカテゴリーデータといいます。
値は飛び飛びの値(離散的)になるのが特徴です。
たとえば、「@好き」「A嫌い」のどちらかを選んで答えるのに数字に○をつけるケースなどです。
1.5とか1.7という数値は出てきません。そういう意味で離散的値(飛び飛びの値)をとります。
カテゴリーデータは、アンケート調査のように、調査の回答として出てくるのによく出会います。
カテゴリーデータの特徴は、対象の性質をあらわしたり、現象をあらわしたり、区別をあらわしたりしているところです。
カテゴリーデータは、二つのパターンに分かれます。
ひとつ目は、文字そのままでは集計できませんので、たとえば「1.東京都 2.埼玉県」のように番号を付けて調査します。これを名義尺度といいます。
もうひとつは、「@満足」「Aやや満足」「Bどちらでもない」「Cやや不満」「D不満」というように順序関係をもたせるもので順序尺度といいます。
ビジネスの場合などでは、カテゴリーデータに出会う機会が多いといえます。
データは2種類に分類できる 関連ページ
- 日常生活における統計的思考
- 経験の理解
- 統計とは何だろう
- 記述統計と推測統計
- 標本の収集(サンプリング)
- 収集された標本の記述
- 統計的変量
- 統計的変量2
- 誤差・精度・測定値
- データのまとめ方
- 時系列
- 中央値
- 平均値
- ばらつき
- 分布の形状
- 歪み
- a
- a
- a
- a
- a
- a
- a
- a
- 統計は「どんな人」でも使える
- 「どんなとき」に使うかを理解する
- 統計で会社や製品への信頼感が増す
- 「どんなメリット」があるかを押さえる
- 統計は万能ではなく、限界もある
- データ収集にはいろいろな手段がある
- 母集団と標本を理解する
- データの形式で手法にちがいがある
- データを処理する手順を知る
- 見やすい階級をつけて集計する
- グラフをつくりその特性を読み取る
- ソルバーの威力
- 相乗平均
- ビッグデータ
- オープンデータ
- データマイニング