見やすい階級をつけて集計する
見やすい階級をつけて集計する
並べ替えデータに階級をつけて集計する。階級のつけ方のポイントは見やすくすること。
階級を見やすくつけるということは重要です。並び替えて、異常値がないと判断したら、次のステップではデータに階級をつけます。
大学生の身長の生データをそのままグラフにしても煩雑で、目で見てデータの特徴はなかなかわかりません。そこで、階級に分けて集計します。
大学生の身長の生データを下の図表のように155〜159まで、160-164まで、165-169まで、170-174まで、175-179まで、180-184のように階級にまとめることにします。
このように最小値と最大値の間の値を区切っていくつかのグループに分けることを「階級をつける」といいます。
各階級の真ん中の値を階級値といいます。たとえば155〜159の階級の階級値は両者を足して2で割った157になります。
階級をつける目的は、視覚的にデータ全体の特性が判断できるようにするためです。ですから、階級の幅が小さいとデータ全体の特性がわからなくなりますし、幅が大きくなると、データが一箇所にまとまってしまいます。
見やすい階級のつけ方は、一般には5段階から12段階にすることだといわれています。
見やすい幅を求める公式もありますが、特別な目的がない場合には区切りのいい値で階級に分けると見やすい表になります。
100個のデータがあるとすれば、7〜8段階にするのが見やすいと言われています。
階級が決まったら次は集計する
階級が決まったら次の作業は、各階級のデータ出現回数を集計します。出現回数のことを度数といいます。階級ごとの度数を集計して表にしたものを度数分布表といいます。
前の図で用いた男子大学生の身長の例題ではデータ数が60で階級は6階級に分割しています。
度数分布表では集計した結果から、データ全体を1としたとき、各階級のデータが全体の中でどのくらいの割合かを示す相対度数を、そしてそのつみ重ねをとった累積相対度数を求めます。
見やすい階級をつけて集計する 関連ページ
- 日常生活における統計的思考
- 経験の理解
- 統計とは何だろう
- 記述統計と推測統計
- 標本の収集(サンプリング)
- 収集された標本の記述
- 統計的変量
- 統計的変量2
- 誤差・精度・測定値
- データのまとめ方
- 時系列
- 中央値
- 平均値
- ばらつき
- 分布の形状
- 歪み
- a
- a
- a
- a
- a
- a
- a
- a
- 統計は「どんな人」でも使える
- 「どんなとき」に使うかを理解する
- 統計で会社や製品への信頼感が増す
- 「どんなメリット」があるかを押さえる
- 統計は万能ではなく、限界もある
- データ収集にはいろいろな手段がある
- 母集団と標本を理解する
- データは2種類に分類できる
- データの形式で手法にちがいがある
- データを処理する手順を知る
- グラフをつくりその特性を読み取る
- ソルバーの威力
- 相乗平均
- ビッグデータ
- オープンデータ
- データマイニング