医療統計学:記述統計と推測統計

統計学セミナー

医療統計学:記述統計と推測統計

 

                    医療統計学、医療経済学、数学のつぼをたとえ話でわかりやすく解説

 

                    運営者の20年以上にわたる医療統計学のノウハウを満載

 

記述統計と推測統計

 

統計の教科書においては普通、

 

1)記述統計(観測値を要約し、記述するための方法)

 

2)推測統計(観測値を推定や予測をするための基礎として用いる方法。すなわちこれまでに観測されていない状況について推測する方法)
の二つの区別がなされています。

 

すでに述べた日常生活における三つの話題をふり返ってみましょう。さて、上に示した意味で、いずれが記述的でありいずれが推測的でしょうか。

 

(a)平均すれば、私は車を一週間に約150キロメートル運転する。

 

(b)毎年この頃になると雨が多く降る。

 

(c)試験勉強を早く始めれば、試験においてよい成績を修めることができる。

 

(a)は経験をまとめようとしており、よってこれは記述的です。

 

しかるに(b)と(c)はこれまでに観測された以上のことを述べており、将来において何が起こりそうかという推測を行っています。

 

記述統計と推測統計の相違は、標本と母集団の相違であるといってもよいでしょう。

 

統計的な専門用語としての母集団は、必ずしもその英語(Population)が示すように人々の集団を表すわけではありません。

 

それは、人々を表すこともありますが、そのほかにもハツカネズミを表すことや、特別なブランドの電球を表すこともあり、さらに東京の市街地にある標準的家屋、隕石、高校における期末試験の成績を表すなどさまざまです。

 

要は母集団とは統計家が推測や推定を適用したいと考えているすべての物や状況をさすのです。

 

それゆえ、さまざまな統計家がいて、それぞれが(すべての)ハツカネズミの学習能力を推測したり、ある特別なタイプの(すべての)電球がどれくらい長くともっているであろうかを予測したりします。

 

あるいは(すべての)標準的家屋を修繕するためのコストを推し量ったり、(すべての)隕石の構成を予測したり、さまざまな試験に合格する(全)受験者の数を推し量ったりするわけです。

 

もう1点注意しておきたいことがあります。研究者は何も母集団中の個体のすべての面に興味をもってはいないということです。

 

むしろ研究者は、個体が共通してもつ数多くの属性や特色のうち、いくつかにのみ(それも1つだけのことが多いですが)興味をもつことの方が多いのです。

 

たとえば心理学者は、ハツカネズミの尾の長さや、一度に生まれてくる子供の数について知りたいとは思わないでしょう(もちろん他の研究者にとっては、これらの特性は興味深いものであろうが)。

 

彼は単にハツカネズミの学習能力にのみ興味を抱いています。

 

さらにまた宇宙物理学者にとっては、落ちてくる隕石の地理的分布とか大きさは、その成分の構成に比べて、おそらくさほど興味深いものではないでしょう。

 

しかしながら、たとえこれらの研究者が母集団の一つの特性にのみ興味の対象を絞ったとしても、それらすべての個体について調べることはまず考えられません。

 

通常、彼ができることといえば、母集団内から選べれた標本・・・比較的小さく選ばれたもの・・・を扱うことです。

 

時間と費用の節約からこれを行わなければならないことも多いわけです。

 

たとえば宇宙物理学にとってみれば、これまで地球上に落ちてきた隕石をすべて調査するために、世界中を旅行することは膨大な費用のかかることです。

 

また、ある会社の研究者が自社の電球の寿命を「破壊テスト」によって推定しようとしたならば、母集団すべてを試験することは不可能です。

 

そうすれば、一つも売るものがなくなってしまうからです。

 

ときには、母集団のすべての個体を調べること自体、論理的に不可能なこともあります。

 

母集団が無限のこともあれば、あるいは調べようにも手に入らないこともあります。

 

たとえば、ハツカネズミの学習能力について研究している心理学者は、彼の得た結果とそれに基づく推測を、何らかの形ですべてのハツカネズミに対して適用したいと考えるでしょう。

 

単にこの時点で存在している幾百万ものハツカネズミだけではなく、まだ生まれていない数え切れない数のハツカネズミに対してもです。

 

さらに彼は、彼の得た結果を一般化して人間の学習能力を説明できればと考えるかもしれません。

 

同様に宇宙物理学者は、彼の統計を用いて、単にこれまで地球上に落ちてきた隕石だけではなく、さらに将来落ちてくる隕石に対して一般化したいと考えます。

 

さらに彼は、宇宙を飛び交うその他の物体の構成についても推測したいと思うかもしれません。

 

このような研究者はすべて、現在利用可能な情報をはるかに超えたことを試みています。

 

彼らは、標本から母集団へ、現在見えるものから見えないものへと一般化しているわけです(誰もが日常の“常識”を用いる場合、気づかないうちに何らかの形で一般化を行っているわけです)。

 

標本を一般化するというこの考え方は、科学のみならず芸術の分野にも用いられています。

 

たとえば、D.H.ローレンスとジョセフ・コンラッドが小説家としてどのように異なるかを一般的に述べるためには、彼らの作品のすべてを読む必要はありません。

 

各々の著者による二三の作品からなる標本を見ればよい。

 

ともかく、記述統計というのは、標本をまとめたり、記述したりするためのものです。

 

これに対して推測統計は、標本に基づき、より広い母集団に対して推定、推測を行うためのものです。

 

生物学者が、ひな鳥の餌付けの実験を行ったとしましょう。

 

彼は記述統計を用いて60匹のひな鳥からなる標本が、ある混合物を餌として与えたならば、通常の餌を与えられた同様の標本よりも速く成長すると報告したとしましょう。

 

通常、彼はそこに見られる事実以上のことをいおうとしています。

 

つまり、彼は推測統計を使ってすべての同様なひな鳥(より広い母集団)も同様な餌を与えれば、より速く成長すると主張するのが普通です。

 

このような「部分から全体へ」の一般化には、どれほどの危険が伴うのであろうか。まさにこれが統計学の興味の対象となるところです。

 

すなわち、誤りを犯す確率を定量化することにあります。

 

しかしながら、この段階で一つだけいうことができるのは、一般化の信頼度というのは、いかにその標本が母集団を写しているかによるということです。

 

はたしてその標本が本当に母集団を代表するものといえるかどうかです。

 

たとえば、「ある12歳のイギリスの少年たちのグループに対し、会話によってフランス語を教えてところ、教科書を用いて教えた同様のグループよりも目に見えて上達が速かった。」というある教育学研究者の意見が発表されたとしましょう。

 

他の研究者と同様、彼もまた、その標本の中に含まれる特別な少年たちの語学修得力にのみ興味を抱いているわけではありません。

 

彼はその他の人々(彼にとってのより広い母集団)が、どのようにすれば最もよくフランス語を学ぶことができるかを示すために、それを一般化したいと思っています。
さて、ここで用いられた標本と同様、会話による方法が効果的であるという事実は、次の母集団のうち、いったいどの集団に対して最もあてはまるであろうか。

 

また、それらのうち、どの集団に対しては最もいえそうもないでしょうか。

 

(i)すべての12歳のイギリスの子供たち

 

(ii)すべての12歳のイギリスの少年たち

 

(iii)すべての12歳の少年たち

 

(iv)すべての少年たち

 

(v)すべてのフランス語を勉強する人たち

 

問題となるのは、「その標本はどの母集団を代表するものと最も考えられるか、またその反対に、最も考えられそうもないか」ということです。

 

それゆえ、その標本に見られた会話による方法の優位性は、母集団(ii)、すべての12歳のイギリスの少年たちに対して最もあてはまるように思われます。

 

しかしこれには大いに疑問の余地があります。すなわち、その標本がどうしてすべての12歳の少年を代表しているといえるでしょうか。たとえば、その標本は、母集団全体に見られるさまざまな才能、語学に対する興味、語学経験などを持った少年たちをすべての面において同様に扱っているといえるでしょうか。

 

標本から母集団への一般化の試みが大きくなるほど、より多くの誤りを伴うこととなるのはしかたのないことです。

 

少年と少女とでは、異なる方法で勉強するのがよいかもしれません。

 

また、外国の子供たちはイギリスの子供たちと同様の方法で勉強するのがよいとは限りません。

 

さらに、大人の場合には子供たちとは異なる勉強方法が必要かもしれません。

 

このように考えれば、この標本からの結論が最もあてはまりそうにもないのは、(v)の母集団、すなわち勉強する人すべてです。

 

一般化のしすぎは日常会話には数多く見られるが、ときには科学論文においても散見されます。

 

研究者の中には、標本中の個体が一般化したいと思っている母集団の個体とは重要な点で異なるということに気がつかないこともありえます。

 

次のような例も考えてみましょう。第二次世界大戦中、R.A.F.(英国空軍)爆撃機の操縦士たちが襲撃から帰ってきて、次のような質問を受けました。

 

「敵機による攻撃はどの方向から最も多かったですか」大部分の答えは“後上方から”ということでした。さて、あなたが操縦士であるとした場合、このことがR.A.F.爆撃機について一般的にあてはまると考えることはなぜよくないのでしょうか。(ヒント 操縦士の標本がどのような母集団からとられたかを考えてみること。)

 

この問題は決して簡単ではない。もし一般化に誤りがあるとすれば、それは敵の攻撃からの生存者にのみインタビューできたということです。

 

後下方からの攻撃も後上方からと同様に行われたと考えられますが、敵からすればその方が成功したわけで、その結果、標本の中にはそれらが反映されていないわけです。

 

もっと勉強したい方は⇒統計学入門セミナー

 

統計学セミナー

医療統計学は、自己学習ではどうしても時間がかかってしまい効率悪くなりがちです。本セミナー受講により、医療統計学の理論だけでなく実際の作業をどう進めるかなど、具体的な方法を伝授します。これにより、医療統計学の理解が倍増すること間違いなし!この機会にぜひご活用ください。



HOME プロフィール 統計セミナー 出張相談サービス お問い合わせ