医療統計学:誤差・精度・測定値

統計学セミナー

医療統計学:誤差・精度・測定値

 

                    医療統計学、医療経済学、数学のつぼをたとえ話でわかりやすく解説

 

                    運営者の20年以上にわたる医療統計学のノウハウを満載

 

誤差・精度・測定値

 

一般的にいって標本からデータを採集する場合、次のどちらのデータがより精確でしょうか。

 

(a)自分の目で観測し、採集したデータ

 

(b)質問を行い、その解答として採集されたデータ

 

(c)(a)も(b)も精度においては変わらない

 

われわれ自身が観測を行い、その結果集められたデータの方がおそらく質問の解答として得られたデータよりも精確でしょう。

 

質問事項に対しては、質問をされた人が誤った情報を与える可能性が数多く考えられます。

 

まず、彼らはその質問をまちがえて理解しているかもしれません。

 

あるいは、質問された内容が記憶になく(たとえば、先週彼らがどれだけガソリンを消費したか)、かわりに“あてずっぽう”で答えるかもしれません。

 

また、彼らが故意にうそを記録することも、もちろんありえます(たとえば、彼らの年齢や所得について)。

 

しかしながら、すでに述べたように、統計的データにおいては、完全な精度というものを期待することはできません。

 

たとえ自らの手によって数え、測定したとしても、何らかの“誤差”はつきものです。

 

仕事に集中し続けたり、あるいは一定のスピードで集中をし続けることを強いられれば、われわれは誤ったカテゴリーに標本中の個体を割り当てたり、ある個体を二度数えたり、また見落としたりする可能性もあります。

 

さらに測定を行う場合には、用いられる器具の能力(たとえば、定規の目盛り)の限界から、厳密な長さは決して記録することができず、その値に最も近いセンチメートル、あるいはミリメートルを記録するにすぎません。

 

それゆえ、部屋の長さが4メートルと記録された場合は、3.5メートルから4.5メートルまでの長さのどれかを測っていることになります(メートルで測ると、これよりほんの少し小さな部屋が3メートルと記録され、またほんの少し小さな部屋が3メートルと記録され、またほんの少し大きな部屋が5メートルであると記録される場合もあります)。

 

つまり、この記録値は大小どちらの方向にも50センチまでの誤差の可能性が考えられます。

 

この場合、その部屋の長さを4メートル±50センチであると述べることによって誤差の限界を示すことができます。

 

さて、この部屋の長さの記録値がそれぞれ

 

(i)誤差の可能性の範囲が50センチより小さい

 

(ii)まったく誤差がない

 

となるように測定することは可能であろうか。

 

たとえば、1センチまで測れるように、より小さな測定の単位を用いれば、誤差の範囲はより小さくすることができます。

 

たとえば、その部屋をセンチの単位まで測ったとき、3メートル90センチであったならば、本当の長さは3メートル89.5センチから3メートル90.5センチまでの範囲に入っています。

 

それゆえ、誤差(記録値と本当の値との差)があったとしても、それはせいぜい0.5センチでしょう。

 

しかし、いかに測定の単位を小さくしていったとしても(たとえば1ミリメートルまだ測ったり、あるいは0.1ミリメートルまで測ったにしても)決して誤差の範囲をゼロにすることはできません。

 

同じことが、重さや時間やその他のさまざまな測定についてもいえます。

 

実験を行う科学者たちは、測定のためにより精巧な測定道具をあみ出そうと発明の才をいかんなく発揮します。

 

しかし、いかに道具が洗練されたとしても、真の値と観測値との間には、何らかの相違が(無限に小さくなったとしても)残っていることを認めざるをえません。

 

精度をあげることは、たとえ可能であったにしても、通常、非常にコストのかかるものです。

 

ここでコストというのは、単にお金だけではなく、たとえば時間なども含みます。

 

そのため精度をあげようと悩むことは、必ずしも価値あることとはかぎりません。

 

たとえば、もしさきほどの部屋にカーペットを敷きたいとすれば、あなたはその長さや幅を1センチの単位まで正確に知る必要があります。

 

しかし、その部屋の壁を装飾するためにペンキを買うとすれば、50センチの単位まで測れば十分です(あるいはメートルですらかまわないかもしれません)。

 

それ以上正確に測定したとしても、あなたの購入するペンキの量は変わらないでしょう。

 

起こりうる誤差の範囲が、その問題としている分野によって異なるのはきわめて自然なことです。

 

おそらく、自然科学においては、それらは非常に小さく、社会科学では、それに比べれば誤差の範囲はかなり大きいと思われます。

 

さらに、経済学や経営学においては、多くのデータが質問により集められ、ほとんどその解答に対する吟味がなされないため、誤差は非常に大きなものとなる可能性があります。

 

たとえば、さまざまな町における失業率やさまざまな産業からの生産額といったような国レベルの数字では、10パーセントや15パーセントの誤差はいとも簡単に起こります(これが、将来の人口やインフレ等の予測があまりにもあたらない原因です)。

 

問題としている分野が何であれ、観測値や記録値が何らかの真の値の“近似”にすぎないということを認識しておくことは大切です。

 

注意深く数を数え、そして質問に対する解答者の十分な協力が得られたならば(あるいは十分小さな単位まで注意深く測定したならば)、データに含まれる誤差は最小のものとなるはずです。

 

そのとき、標本に現れる数字は、それらに基づき意味のある決定を行うにたる程度には、精確なものとなっているでしょう。

 

しかし、もし私たちの勘定や測定が不注意なものであったり、粗雑なものであったなら、あるいは誰か他人が手抜きして集めた可能性のある(可能性があるというのは本当のところは知りようがないから)データに頼らざるをえないとすれば、誤差は大きなものとなる可能性があります。

 

とすればそのデータを解釈する際、さほど確信が持てないこととなります。

 

一般に言われていることには反しますが、統計では「石炭をみがいてダイヤモンドを作る」といったことはなしえません。

 

いったんデータが集められ記録されたならば、たとえそれがうまく集められていようがいまいが、いかに統計的な操作を施したとしても、そのデータの精度を改良することはできません。

 

もっと勉強したい方は⇒統計学入門セミナー

 

統計学セミナー

医療統計学は、自己学習ではどうしても時間がかかってしまい効率悪くなりがちです。本セミナー受講により、医療統計学の理論だけでなく実際の作業をどう進めるかなど、具体的な方法を伝授します。これにより、医療統計学の理解が倍増すること間違いなし!この機会にぜひご活用ください。



HOME プロフィール 統計セミナー 出張相談サービス お問い合わせ