データの形式で手法にちがいがある
データの形式で手法にちがいがある
組み合わせがないデータと組み合わせがあるデータに分かれている
組み合わせのない一変量の形式と、組み合わせがある二変量以上の形式の二つです、
組み合わせがない形式は、身長を測定した値とか、体重を測定した値とか、数学の試験の結果の点数・・・などのように数値が羅列されているだけのものです。
このような形式のデータを一変量のデータといいます。
組み合わせがあるデータとは、ある人の体重と身長とウエストなどのように、数値が組になっている形式のデータです。
二つの数値の組み合わせを二変量のデータといい、それ以上の数値の組み合わせ形式を多変量データといいます。
どちらかいえば、実社会は組み合わせがあるデータが入手できるケースの方が多いといえます。
また、組み合わせがあるデータでよく出てくる形式として、片方のデータが時間単位の場合、すなわち年度、日付・・・・になっていることがよくあります。
そのようなデータを、特別に時系列データといいます。広辞林には「現象の時間的変化を連続的または一定期間隔をおいて不連続に観測して得た値の系列」と説明されています。
データの形式によって取り扱う統計手法が異なる
データの形式によって統計的に処理する方法が異なります。
組み合わせがない数量データの場合は、データを並べ替え、階級に分け、集計し、グラフを描きデータの特性を分析する手順をとります。
カテゴリーデータで組み合わせがない場合は単純に度数の集計をします。
組み合わせがある数量データの場合は、散布図の作成・データ間の関連分析をします。
多変量データのときはいろいろな組み合わせの散布図を描いてなにか特徴がないかを探ります。
組み合わせがあるカテゴリーデータの場合は、単純な度数の集計、いろいろな変量の組み合わせのクロス分析をします。
処理の目的はデータがなにを訴えているのか、どんな特性があるかを探ることです。
データの形式で手法にちがいがある 関連ページ
- 日常生活における統計的思考
- 経験の理解
- 統計とは何だろう
- 記述統計と推測統計
- 標本の収集(サンプリング)
- 収集された標本の記述
- 統計的変量
- 統計的変量2
- 誤差・精度・測定値
- データのまとめ方
- 時系列
- 中央値
- 平均値
- ばらつき
- 分布の形状
- 歪み
- a
- a
- a
- a
- a
- a
- a
- a
- 統計は「どんな人」でも使える
- 「どんなとき」に使うかを理解する
- 統計で会社や製品への信頼感が増す
- 「どんなメリット」があるかを押さえる
- 統計は万能ではなく、限界もある
- データ収集にはいろいろな手段がある
- 母集団と標本を理解する
- データは2種類に分類できる
- データを処理する手順を知る
- 見やすい階級をつけて集計する
- グラフをつくりその特性を読み取る
- ソルバーの威力
- 相乗平均
- ビッグデータ
- オープンデータ
- データマイニング