ビジネス書書評
統計学が最強の学問である
データ社会を生き抜くための武器と教養
あえて断言しよう。
あらゆる学問のなかで
統計学が最強の学問であると。
どんな権威やロジックも吹き飛ばして
正解を導き出す統計学の影響は
現代社会で強まる一方である。
「ビッグデータ」などの言葉が流行ることも
そうした状況の現れだが、
その本当の魅力とパワフルさを
知っているだろうか
本書では
最新の事例と研究結果をもとに、
今までにない切り口から
統計学の世界を案内する。
なぜ統計学が最強の学問なのか
統計リテリシーのない者はカモられる
なぜ統計学が最強の学問なのか
統計リテラシーのない者がカモられる時代がやってきた
統計学は最善最速の正解を出す
すべての学問は統計学のもとに
ITと統計学の素晴らしき結婚
サンプリングが情報コストを激減させる
誤差と因果関係が統計学のキモである
ランダム化という最強の武器
ランダム化ができなかったらどうするか
統計家たちの仁義なき戦い
巨人の肩に立つ方法
エビデンスを探してみよう
<なぜ統計学が最強の学問なのか>
ウェルズは将来、統計学的思考が読み書きと同じようによき社会人として必須の能力になる日が来ると予言した
ハーバード大学のメディカルスクールで使われている統計学の教科書には、冒頭にこんなことが書かれている。
ウェルズはサイエンスフィクションの父とも呼ばれる作家、思想家だ。タイムマシンや透明人間といったSF的なアイディアは彼の著作を通して有名になったし、彼の幅広い科学的知識と先見性は、核兵器や国際連盟、それに今で言うウィキペヂアのような百科事典の登場すら予言したと言われる。
現代的な統計学の黎明期である1903年当時になぜウェルズがそう予言できたのかは定かではない。しかし、彼に遅れること100年ほど経った今、私たちは間違いなく読み書きと同じレベルで、統計学的な思考方法を求められています。読み書きする能力のことをリテラシーを呼びますが、統計学的なリテラシーがないのは現代を生きる私たちにとって大変危険な状況といえます。
読み書きが出来なければ契約書や法律の中身を理解できませんし、統計リテラシーがなければ確率やデータを知ることもできません。いずれにせよ、合法的な詐欺の被害者になっても文句が言えない、無防備すぎる状態と言えます。
あみだくじの必勝法
卑近な例では、あみだくじがあります。ある日、参加者5名の倍の数の10本の縦線を引き、私が残りの参加者には見えないように左から5番目の縦棒の下に星印をつけ、残り4人の友人には逆に私に見えないように4本ずつ横の線を引いてもらうといったルールで行うとします。参加者はじゃんけんで勝った順番に@〜Iの縦棒の中からまず1か所ずつを選び、ひと通り終わった後はその逆順で選ぶ。そして星印に当った者が罰ゲームというルールである。
もし、何のためらいもなく直感のみを頼りにしてこのあみだくじに参加したとしたら、あなたはかんら分の悪い勝負をすることになります。
試しにこのルールで1000回繰り返したとして、縦棒ごとの当る回数をシミュレーションすると図のような結果になります。つまり端が最も低い確率で当たることになります。
実際こうしたルールでアミダクジをやったところ、友人たちのクセなのか、人間心理の傾向なのか、両端の縦棒を先に選べれたことはほとんどなかった。
つまり、一見5分の1つまり20%ずつの確率で公正に決めようとしていると思いつつ、両端を選び続ける私が罰ゲームを受ける確率は少ないことになります。
ちなみに、公共工事の入札が、「同条件なら最後はあみだくじで決める」という地方自治体もあるらしいので、この知識を応用するだけで売り上げを増やせる会社もあるかもしれない。
統計学を制する者が世界を制する
もちろん横棒を引く過程がシミュレーション通りに完全ランダムとはいかないし、いくら確率が低いとは言っても私が当りを引くことがないわけではない。だが、統計学さえ知っていれば不確実性のある状況下においてちょっとしたズルを行うことができるのは、何もこうした話だけには留まらない。
例えば私がデータ分析に関わったある小売企業では、これまで漫然と送っていたダイレクトメールについて「どういった顧客には送り、どういった顧客には送らないか」といった選択を最適化することによって売上をほんの6%ほど上げるやり方がわかった。1000億円ほどの売り上げのほんの6%だから、見込まれる売上の増加はほんの60億円ほどだ。DMを送る量自体は増やすのではないため、特にコストがかかるわけでもなく、「DMを送ることで購買額を増やす顧客」と「そうでない顧客」をただ明らかにしただけで、あたかもあみたくじでズルをしたかのように売り上げにして60億円のズルができるのです。
統計学は21世紀に残る我々にとって必須スキルであり、多くの人間にとって最強の武器となる可能性を秘めています。ビジネス領域における統計学を応用したソリューションのことをビジネスインテリジェンスと呼びますが、このインテリジェンスという言葉は、スパイ映画に出てくるCIA(Central Intelligence Agency)のIの文字が示すものです。それに、兵法の古典中の古典である孫子の時代から、戦いにおける情報の重要性はいくら強調してもしすぎることはありません。
情報を制する者が世界を制する、という言葉を現代において言い換えるならば、統計学を制する者が世界を制するということなのである。
<統計学が最強の武器になるワケ>
なぜ統計学は最強の武器になるのだろうか?
その答えを一言で言えば、どんな分野の議論においても、データを集めて分析することで最速で最善の答えをだすことができるからです。
もしあなたが、小売企業で働いていて、社長キモ入りの全社横断プロジェクトで売り上げ増加を目指すとしたら、一体どういうことに取り組むことになるでしょう。
おそらくさまざまな部署から、偉い人たちがやってきて、「自分の感覚では」とか「長年の経験に基づくと」といった主観的根拠で勝手なことを言い出すだろう。
断言してもいい。もしあなたの会社に十分なデータがあるならば、データを分析せずに感と経験だけに基づく議論をするのは時間の無駄だ。そして大抵の場合は、会議参加者の人件費の分だけお金もムダだ。日本の多くの会社は、時給800円でアルバイトをする若者が仕事をサボることは叱るくせに、時給換算でその何倍もの人件費を支払われている人間が会議で不毛な時間を過ごすことに対しては思いのほか無頓着である。
そして、センスだけのアイディアで過ちを犯した場合に困るのは経営者と従業員と取引先ぐらいだが、世の中にはしばしば過ちを許すことが絶対に許されない場合がある。例えば大量の人の命がかかっている場合などはそれに該当するだろう。
もしあなたが、選択を誤れば10万人の命が失われるといった状況に置かれたら、いったい何を根拠に判断を下すだろうか。そのようなときにあなたは上司の直感や経験だけに任せて決断を行うだろうか。
あるいは総理大臣なり厚生労働大臣なり、権限のある人たちが、あなた自身やあなたの家族の命も含め、10万人の命がかかった選択を、何の根拠もなく権力者たちのご意見のみで決めたとしたらあなたはどう感じるだろうか。
判断を誤れば10万人の命が失われる意思決定、という状況はまるでSF映画の中の出来事のように感じられるかもしれない。だが、医療、なかでも私が専門とする「公衆衛生」や「社会医学」「保健行政」といった領域においては、今この瞬間にも慎重な議論を経てそういった決定を下している真っ最中なのである。
たとえば日本では毎年35万人ほどががんで亡くなり、19万人ほどが心臓病で亡くなり、3万人ほどが自殺している。適切な予防や治療の方策さえ取れれば、このうち何万人もの命が救われるはずなのだ。
こうした大量の人命がかかった間違いの許されない選択において最善の答えを出すために、人類は19世紀のロンドンで、史上はじめて統計学の力を使って万単位の人命を奪う原因に戦いを挑んだ。
原因不明の疫病を防止するための学問を「疫学」と呼ぶが、世界で最初の疫学研究は19世紀のロンドンで、コレラという疫病に対して行われた。この疫学の中でも統計学は大きな役割を果たす。
この当時コレラはイギリス全土で4度の大流行をおこし、合計十数万人もの死亡者を出したといわれている。現代ほど科学技術が進歩してはいないにせよ、当時のロンドンには高い教育を受けた科学者も医者も、優秀な役人も十分にいた。彼らの多くは聡明で論理的でもあっただろうが、残念なことにコレラの流行に対しては無力だった。というか、むしろ場合によっては有害ですらあった。たとえば、ある医者が提案したのは、彼の調合した特別な消臭剤によってコレラが減らせるというものだった。
当時のロンドンは産業革命の真っ最中で、農業で食べていけなくなった人々が都会へ押し寄せ、工場で労働者として働くようになりはじめた時期であった、急激な人口の増加に都市の発達が追い付かず、狭く不潔な地域に粗末な家がひしめき、その家の中に貧しい人がおしこめられ、下水も整備されないためにゴミや排泄物が庭や地下室、道端といったそこらじゅうに貯めこまれていた。当然その悪臭たるや悲惨なものだっただろうが、そうした「臭い地域」に住む臭い労働者たちの多くがコレラで死亡していたため、悪臭を取り除きさえすればコレラもなくなるのではないかと考えたのだ。
さらには、もっと果敢にこの汚物を取り除こうとした役人もいた。彼は街中の汚物を片っ端から清掃し、下水を整備し汚物を川へ流せるようにする、という政策をとった。この役人が活躍したのは主にコレラの一度目と二度目の大流行時の間の期間だが、彼らの努力にかかわらず、二度目の大流行時(死亡者約7万人)は、むしろ最初の大流行時(死亡者約2万人)よりも大量の死亡者を出している。要するに、知性も見識も十分にある彼らが、知恵を絞って出したアイディアも、時間と労力をつぎ込んだ事業も、ムダか、もしくはむしろ有害だったのです。
疫学の父 ジュン・スノウの活躍
では彼らはいったいどうすべきだったのだろうか、疫学の父と呼ばれるジョン・スノウという外科医がやったことはごくシンプルだ。
●コレラで亡くなった人の家を訪ね、話を聞いたり付近の環境をよく観察する。
●同じような状況下でコレラにかかった人とかかっていない人の違いを比べる。
●仮説が得られなかったら大規模にデータを集め、コレラの発症/非発症と関連していると考えられる「違い」について、どの程度確からしいか検証する。
彼は調査した結果を詳細なレポートとして冊子の形にまとめあげているが、その中で最も端的にコレラの予防方法を示しているのは図表3だ。
当時のロンドンでは複数の水道会社が営業しており、同じ地域の隣り合う家でも異なる水道会社を使っているということがしばしばあった。図表に示すスノウが行った分析は、同じように貧しく不潔な地域における、利用している水道会社別での家屋数とコレラによる死亡数の集計である。
調査期間中、水道会社Aを利用している家に住む者が1263名死亡しているのに対し、水道会社Bを利用している家からは98名しか死亡していない。もちろんこの死亡者数を単純に比べたのではフェアではないから、「家屋の数」で調整してやらねばならないだろう。家屋の数が多ければそれだけコレラ感染者が含まれる確率だって大きくなるからだ。
だからスノウは家屋1万件あたりという条件をそろえたうえで両者のコレラ死亡者数を比較した。だがそれでもやはり水道会社Aを利用している家では8.5倍も死亡者が多い。
わざわざ使っている水道会社で住む家を選ぶといった習慣は当時のロンドンには存在せず、同じ地域の中では1つの家屋の大きさや、その中に住んでいる人数は平均的にほぼ等しいと考えられる。ほぼ同じような条件で、ただ使う水道会社だけが異なる家々の間で8.5倍もリスクが違うのであれば、そこに何らかの理由があると考えるべきだろう。
だからスノウの提案したコレラ流行の解決策もごく単純なものだった。「とりあえずはしばらく水道会社Aの水を使うのを止める。以上」
なおスノウがこの考えを発表してからおよそ30年後、ドイツの細菌学者コッホはコレラの病原体である「コレラ菌」を発見し、その結果、コレラが水中に生息することや、コレラ患者の排泄物に含まれること、そしてコレラ菌の存在する水を飲むことでコレラに感染することも証明された。
実は水道会社Aと水道会社Bの違いは、前者がロンドンの中心を流れるテムズ川の下流から、後者はテムズ川の上流からそれぞれ採水しているというものだった。そして当時のテムズ川には、前述の勇敢な役人の努力によって大量にコレラ患者の排泄物が流し込まれていたのである。つまり彼は、効率的にコレラ患者を拡大再生産させる社会システムを意図せず作り上げてしまったのだ。
コッホの発見には科学的価値があるが、一方で、病原体が何であろうが、コレラの発症がどんなメカニズムでもたらされるものであろうが、コレラの流行を止めたいという目的に対して飲料水の水源を変えさえすればよいという事実に変わりはない。
残念なことにスノウの主張は「科学的でない」あるいは「確実な証拠がない」として学会や行政からは退けられたが、彼の助言に従ってコレラに汚染された水の使用を止めた町ではぱったりとコレラの感染が止まった。
コレラの話からもわかるように、頭やセンスや行動力に優れた人たちを集めて話し合わせただけではこうしたシンプルかつ強力な解決策というのは出てこないし、むしろ握りつぶされることも多い。代わりに出てくるやり方が、理屈としては一見正しくても、無益もしくは有害であることもしばしばである。
人類の寿命は疫学が伸ばした
スノウの提示した疫学という考え方は、徐々に医学全域において欠くことのできない重要なものとなっていった。タバコを吸えば肺がんをはじめとしたがんになるリスクが上昇するということも、血圧が高ければ心臓病や脳卒中になるリスクが高まるということも、現在に生きる私たちにといいては当たり前の常識である。しかし、ほんの50年ほど前に、アメリカのフラミンガムという田舎町で行われた大規模な疫学研究の結果が公表されるまではまったく明らかではなかった。それまでは医者や科学者の中でも、タバコが健康に悪いことなのかどうか、あるいは血圧が高いことが悪いことなのかどうか、さまざまな説があり侃々諤々の議論が重ねられてきたのである。
だが、がんを減らしたければとりあえず喫煙率を下げろ、以上」とか、「心臓病を減らしたければとりあえず血圧を下げろ、以上」といった疫学研究のシンプルな答えが侃々諤々の議論をブッ飛ばしたことで、医学研究と健康政策の方針は変わり、50年前よりも我々の寿命はすいぶんと伸びた。
もしこの判断を、今も、議論だけに基づいた誤ったものとしていたならば、一体どれほどの命が失われていたのか見当もつかないほど統計学は力を発揮したのである。
エビデンスが医療を変えた
疫学という、データと統計解析に基づき最善の判断を下そうという考え方は、スノウの発見から100年ほどかけて、医学の領域においては欠くことのできないものとなった。現代の医療で最も重要な考え方としてEBM、日本語にすると科学的根拠に基づく医療というものがある。この科学的根拠のうち最も重視されるものの一つが、妥当な方法によって得られた統計データとその分析結果というわけである。
スノウの疫学は基本的なデータの集計によってコレラのリスク要因を明らかにしたが、疫学の方法論は徐々に現代的な統計学の進歩を取り込み、より高度で正確なリスクの推定を可能にした。
人間の体には不確実性が多く、データを取って分析すると、生理学な理屈の上では正しいはずの治療法が効果を示さないケースや、経験と権威にあふれる大御所の医師たちがこれまで続けていた治療法が実はまったくの誤りだった、という事例が少しずつ明らかになってくる。
そのため、医師の経験と勘だけでなく、きちんとしたデータとその解析結果、すなわちエビデンスに基づくことで最も適切な判断をすべきだ、というのが現代医学において主流の考え方なのである。
なおこのEBMという考え方が世界的に広まったのは1980年代から90年代にかけてのことであり、現在責任ある立場で臨床を仕切っている医師たちの多くにとっては、「学生時代にはほとんど習っていなかったこと」である。
医師に対する統計学の教育については、アメリカですら課題が多いらしく、研修医に基礎的な統計学のテストをした結果がたいへん残念なものだった、という研究がアメリカ医師会の刊行する学術雑誌に掲載されたこともあるくらいだ。現場レベルまでのEBMの徹底というのはまだまだむずかしいのだろう。
現場レベルではまだまだ課題が多いにせよ、医学において統計学的なエビデンスが最重要視されることに間違いはない。たとえば製薬会社が新しい薬を作ったときは、綿密に計画された研究方法で採取したデータに対して適切な統計解析を行う。そしてその結果を厚生労働省に提出しなければ、新薬が認可されたり保険適用が認められたりすることはない。また、その薬が市販されたあとも、製薬会社は少しでも自社の商品のウリを作るために巨額の研究費用を投じてエビデンスを作り、MRを通じて医師たちに売り込むのである。
前節で述べたように、エビデンスは議論をブッ飛ばして最善の答えを提示する。もちろんデータの取り方や解析方法によって、どれほどのレベルで正しいといえるのか、どこまでのことを正しいと主張して間違いがないのかは異なってくる。しかしながら、エビデンスに反論しようとすれば理屈や経験などではなく、統計学的にデータや手法の限界を指摘するか、もしくは自説を裏付けるような新たなエビデンスを作るかといったやり方でなければ対抗できないのだ。
教育にも活かされるエビデンス
こうしたエビデンスの強力さが少しずつ知られるようになると、その利用は医学だけに留まらなくなってくる。
たとえば近年アメリカの教育学界においては、さかんにエビデンスの重要性が叫ばれ、エビデンスに基づいた教育方法の評価が行われるようになってきている。
その最たるものは、ブッシュ政権時に成立した「落ちこぼれゼロ法」からスタートしたWWCプロジェクトだろう。落ちこぼれゼロ法の中には、不利な状況にある生徒への教育サービスの計画にあたっては、科学的根拠のある研究結果を考慮しなければならないとか、若者の暴力やドラッグを防止すると科学的に示された施策に予算を振り向ける」といったように、合計100回以上も「科学的根拠のある研究」という表現が登場するそうだ。
WWCプロジェクトは、こうした科学的根拠に基づいて教育プログラムを計画したり評価したりするために、これまで行われてきた教育関係の実証研究を片っ端から収集し、系統的に整理した。そしてその結果をインターネット上に公開することで、「どのような教育方法が科学的に推奨されるのか」を明らかにし、全米の教育の質を向上させようとしたのである。落ちこぼれゼロ法という政策自体にはいくつかの問題が指摘されてもいるが、少なくともこうした科学的な姿勢を大々的に教育へ持ち込んだこと自体は大きな功績である。
不思議なもので、教育という分野に関しては、まったくと言っていいほどの素人でも自分の意見を述べたがるという現象がしばしばおこる。よっぽどアウトローな人生を送ってでもこない限り、先進国に住む人間のほとんどは何かしらの形で学校教育を受けているし、子どもが生まれればその教育をしなければならない。
そのため「自分が教育された」あるいは「自分が子どもを教育した」という個人的な経験のみから教育の良し悪しを判断し意見するということがしばしば見られる。あるいは、ただ大学在学中に弁護士になったとか、子供を全員東大に進学させたといった人の個人的な経験をありがたがって信頼するという人もいる。
だが、どのような教育がいいか、という問いへの回答は、教育される本人の特性や能力、環境などさまざまな要因によって左右されるし、医療と同様に不確実性の大きい分野でもある。自分が病気になったときに、まず長生きしているだけの老人に長寿の秘訣を聞きに行く人はいないのに、子供の成績に悩む親が、子供を全員東大に入れた老婆の体験記を買う、という現象が起こるのは奇妙な事態だとは思わないだろうか。
たとえば、
●教師に生徒の成績に基づいた競争をさせて、ボーナスの査定にも反映させればいい
●子どもは小学校入学前から英才教育を施すことで天才に育つはずだ
●数学教育にもっとコンピュータを取り入れて効率をはかるべきだ
など、さまざまなアイディアが、教育学者からも教育者からも、ただの素人からもしばしば提唱される。しかしながら、果たして本当にそれが正しいのかどうかは、結局のところデータと統計学の力を借りなければ誰にもわからないのだ。
ちなみに「教師に競争させてボーナスを査定する」というアイディアについては、2006年から2009年にかけてナッシュビル・リパブリックスクールで延べ2万4千人の生徒と300人の教師を対象に実験が行われた。そして、「統計学的に何の改善もみられないか、むしろ悪影響」という結果が得られている。
2番目の早期教育については、4700名の3歳から4歳までの子供に読み書きと算数の早期教育を行った結果、確かに3歳あるいは4歳の時点では、同年代の他の子供と比べて読み書きや算数の成績が明確に高かったものの、小学1年生になった頃に追跡調査を行ってみると両者の差は消失してしまった、という統計解析の結果が得られている。
科学は時計仕掛けの世界と呼ばれてきた強固な哲学的視点を伴って、一九世紀に突入した。現. 実を説明し、将来の出来事を予測する(ニユートンの運動法則や気体についてのボィルの法則の ような)少数の数学公式が^在すると信じられていた。およそ、そのような予測に必要なことと いえば、これらの完全な公式I式と十分な精度で収集された関連した観測値の群だけだった。大 衆文化がこの科学観に追いつくまでには四〇年以上もかかったのである。
この文化の立ち遅れをよく表しているのが、一九世紀初め、ナポレオン皇帝とピエール.シモ ン■ラプラスとのあいだのやり取りである。ラプラスは地球からのいくつかの観測に基づいて' 惑星や_星の将来の位置をいかにして算出するかを記した記念碑的かつ権威のある書物を著して いた。「ムッシユー-ラプラス、君の論文には神についての言及が見当たらないのだが」とナポ レオンが尋ねると、ラプラスはr私にはそのような仮説は必要ない」と答えたのである。
将来のすべての出来事が過去の出来事によって決定され、神の介入がなくても永遠に続く神不 在の時計仕掛けの世界という考え方に、多くの人々は恐れおののいた。ある意味で、一九世紀の ロマン主義運動は、この推論の冷徹で厳格な使用に対する反動であった。ところが' 一八四〇年代にこの新たな科学の証明が登場すると、人々の思い描く世界はぐらついた。ニユートンの数学 的法則が新たな惑星の存在を予測するのに用いられ、実際に海王星は予測どおりの場所で見つか った"時計仕掛けの世界に対する抵抗はほとんどすべて崩れ去り、この哲学的態度が大衆文化の 本質的な部分となったのである。
しかしながら、たとえラプラスが彼の定式化において神を必要としなかったにしても、彼が 「誤差関数」と呼んだような何かは必要だった。地上の高台から観測された惑Mや■星の位置と、 予測された位?とは、厳密にはー致しなかった。ラプラスと同僚の科学者たちは、このことを観 測上の誤りのせいにした。その誤りは、ときには地球の大気の乱れによって生じ、またあるとき には人為的なミスによって生じる。ラプラスはこれらの誤りをすべて、数学的描写を付加した特 別なもの(H誤差関数)として片づけた。
この誤差関数は誤りを吸い上げ、あとには理論上、純粋な運動の法則だけが天体の真の位置を 予測するために残ることになった。測定が精緻になればなるほど、誤差関数の必要性は薄れるだ ろうと信じられてきた。観測値と予測値のあいだのR細な差異を説明する誤差関数を用いること で、一九世紀初めの科学は哲学上の決定論の掌中にあった。その哲学上の決定論の信念とは、世 界の初期条件や世界の運動を記述する数学公式によって、起こりうるすべてのことは事前に決定 されているというものだ。
一九世紀末になっても、誤差はなくなるどころか増えつづけた"測定が精緻になればなるほど、 さらに誤差が生じたのだ。時計仕掛けの1.0:界はめちやめちやになった。生物学や社会学の法則を発?する試みは失敗に終わった。物理学や化学のような旧来の科学では、ニュートンやラプラス が用いた法則は、大雑把な近似にすぎないことが証明されたのである"徐々に科学は実在(リア リティ|)の統計モデルという新しいハラダィムで動き始めるようになった。ニ〇世紀末までに は、ほとんどすベての科学が統計モデルを使うようになったのである。
大衆文化はこの科学革命に乗り遅れてしまった。「相関」、「オッズ」、「リスク」のようないく つかのあいまいな考え方や表現は知らず知らずのうちに日常用語となり、大半の人々は、医学や 経済学といった科学の一部の分野では不確実性がつきものだということに気づいているものの、 科学者以外で哲学上の視点に淘蛯ネシフトが生じたことを理解している人はほとんどいない。で は' これらの統計モデルとはいったい何だろうか。それらはどのようにして生まれたのだろうか。 実生活上、どのような意味があるのだろうか。現実を正しく描写しているのだろうか。本書はこ れらの疑問に答えようとしたものだ"その過程で、この革命に関わった数人の男女の生涯につい ても触れていきたい。
これらの疑問を扱うにあたって、ランダム性、確率、統計という三つの数学的概念を区別しな ければならない。多くの人々にとつて、ランダム性はまさしく予測できないことを別の言葉で言 い換えたものである。このよく知られた概念は、ユダヤのタルム^^ドの格ー.ー1=1に法来する。「どこ かに埋められた財定を探しにいこうとしたって無駄なことだ。なぜなら、埋められた財宝は偶然 に見つかるものだからである。そして自明なことだが、偶然に見つかるものを探すことは誰にも できはしない」。しかし、現代の科学者にとって、多くの異なるタィプのランダム性が存在する"
確率分布(本書の第2章で触れる)の概念のおかげで、われわれはこのランダム性に制約をもう け、偶然の出来事だが将来を予測しうる限られた能力を得た。だから現代の科学者にしてみれば、V ランダム事象は、でたらめだとか、不意だとか、予測できなかつたものではない。ランダム事象 は数学的に記述可能な構造を持つのである。
確率とは、とても古くから存在する概念の現代語である。それはアリストテレスの言葉のなか に見受けられ、「起こりそうもないことが起こるのが、確率の本質である」と述べている。当初 は、予期という人々の勘もそこに含まれていた。一七世紀から一八世紀には数学者の一派、なか でもM世代にわたるべルヌイ家の人々、フェルマー、ド-モアヴル、パスカルらは、ギャンブル をきっかけに全員が確率の数学理論を研究した。彼らは等しく起こりうる事象を数えることで、
とても精巧な手法をいくつも開発したのである。ド■モアヴルはなんとかしてこれらの手法を微 積分学のなかに導入しょうとし、ベルヌイー族は「大数の法則」と呼ばれる重要な基本定理のい くつかを発見することができた。一九世紀末までには、数学的確率論はきちんとした理論的基礎 を欠きながらも、基本的には精巧な仕組みから形づくられた。
確率理論は不完全であるにもかかわらず、統計分布という開発途上の概念が有用なことを証明 した。われわれが特定の科学的問題を考察する際に、統計分布が現れるのである。例を挙げょう。
一九七一年、イギリスの医学雑誌ランセット(Lcmca)にハーバード大学公衆衛生学部のある 研究が掲載された。その研究は、コーヒーの飲用が下部尿管のがんと関係があるかどうかを調べ たものだった。
この研究は下部尿管のがん患者と他の疾病に罹っている患者からなる、ある患者グループにつ いての報告である。この研究論文の著者たちは、これらの患者の年齢、性別、がんの家族歴など の追加データも収集していた。コーヒーを?爪する誰もが下部尿管のがんになるわけではないし、 下部尿管のがんに植病している誰もがnhヒーを飲用するわけでもないので、著者の仮説に相反 する事象もいくつかは存在する。
ところが、下部尿管のがんに罹病している患者のうちニ五%が、習慣的に一日当たり四杯以上 のコーヒーを飲んでいた。がんに摧っていない患者でそのようなコーヒーの大-M彭用をしてい たのはわずか一〇%だった。この結果は、仮説を裏づけるなんらかの証拠であるようにも思える。
こうしたデー夕の集積が著者たちに統計分布をもたらした。数学的確率論の手法を用い、著者 たちはデータの分布について「確率分布関数」、または単に分布関数と呼ばれる理論的な数式を 求め、それを仮説の検証に用いている。このやり方は、ラプラスの誤差関数と同じだが、より複 雑なものである。確率論を利用して理論的な分布関数を求め、そしてその関数を、?来、同一母 集団の人々からランダムにデータがとられたときに何が起こると予想されるかを表すのに用いる のだ。
本書は、抽象数学の概念である確率や確率論に関する本ではない。本書はいくつかの確率論の 科学的問題への応用、統計分布や分布関数の世界についての本である。確率論だけでは統計手法 を語るには不十分だし、ときとして、統計手法が一部の確率論に違背することも起こりうる。確 率が必要とあらば使われ、さもなければ使われない、というように章によってさまよっていることに読者は気づくだろう。
実際の統計モデルは数学的モデルなので、読者は数学公式や記号のみで完全に理解することが できよう。本書は大それたことをしようと試みるほど意欲的なものではない。私はニ〇世紀の統 計革命を、革命を担った何人かの人々(その多くはまだ存命である)を追うことで描こうとして きた。私は彼らが生み出した仕事の「さわり」に触れただけだが、いかに彼らそれぞれの発見が 全体像におさまつているかを読者に味わつてもらいたいと思つている。
本書の読者は科学データの統計解析に対する十分な知識は持っていないだろう。そのような仕 事に従事するには数年間にわたる大学院での学習が必要である。しかし私は、読者が科学の統計 的な見方で表される基本的な哲学上の奥深いシフトがあったことを多少とも理解したと思ってく れるのではないかと期待している。では、数学者でない人がこの科学革命を理解するためには、 どこから始めればよいだろうか。それでは、ある婦人が紅荼を味わつているところからご案内し たい……o
一九二0年代未のィングランドはケンブリッジ、ある夏の午後のことだった。大学教授たちと その夫人、それに数人の客からなるクルーフが屋外のテーフルを囲み、アフタヌーンティーを楽 しんでいた。ある婦人がこう言い出した。紅茶にミルクを注ぐのとミルクに紅茶を注ぐのでは味 が違うのよ、と。
科学者を自負する男性たちは、それはまったくナンセンスだよと一笑に付した。何が違うとい うのだ?彼らにしてみれば、紅茶とミルクが混ざつてしまえば化学的な違いなどあり得なかっ た。:人の?せた背の低い男がその問題に身を乗り出した。男はぶあつい眼鏡をかけ、灰色の (先を細く尖らせた)ヴァンダィク髭をたくわえていた。
「その命題を検定してみようじゃないか」。興奮しながら、彼はさっそく実験を概説し始めた。
紅茶の違いのわかる婦人
ティーカッフをずらりと並べいくつかには紅茶にミルクを注ぎ残りにはミルクに紅茶を注い で、二つの違いを主張する婦人に飲んでもらうことにしたのである。
読者のなかには、これは取るに足らないある夏の午後のお戯れとして、さっさと片づけてしま えばいいと思う方もいるに違いない。「婦人に違いがわかったところで、どうということもない だろう?」と聞きたいだろう"rこの問題は重要ではないし、科学的に優れた価値もない」とあ ざ笑うだろう。「儺い人たちはそのすばらしい頭脳をもっと人類のために使うべきだよ」と"
あいにく、科学の素人は科学とくればその重要性を第一に考えるかもしれないが、私の経験か ら言わせてもらうと、おのおの研究に従事しているたいていの科学者は、その結果に関心を寄せ. 研究活動を通して知的興奮を覚えるものなのだ。よい科学者ほど自らの研究が最終的にどんな重 みを持つかなど、気にかけないものである。
そう、ケンブリッジの陽光まぶしい夏の午後のことだった。かの婦人は紅茶の淹れ方について 正しかったのか、正しくなかったのか。その婦人が正しいかどうか判断する方法を見つけること をおもしろがって、どうしたら決着がつけられるかと髭の男を中心に話し合いを始めた。
彼らの多くが髭の男とともに熱心に実験準備に加わつた。ほどなくして、婦人に見えないとこ ろで紅茶がニつの違った淹れ方でカップに注がれた。やおら胸を張り、髭の男は婦人に最初の力 ップを差し出した。彼女はちよっとすすって、それが紅茶にミルクを注いだものだと断言した。 男は説明を省いてその答えをノートに書き留めまた次のカッフを差し出した 0
科学の協同性
私はこの話を、その午後その場に居合わせたという男性から一九六〇年代末に聞いた。彼の名 はヒユー■スミス(Hugh smith)。科学論文を書くうえではH.フェアフイールド■スミス (H.Fairl smith)という名前を使っていた"
彼と知り合ったのは、彼がコネチカット大学ストアーズ校で統計学の教授を務めていたころの ことだ。私はそのニ年前にコネチカット大学で博士号を取得していた"ペンシルベニア大学で教 鞭をとったあと、ファイザーという大手製薬会社で臨床研究部門に加わった。
コネチカット州グロートンにある研究所はストアーズ市から車で約一時間のところにあった。 私はファイザーで数学的に難しい問題に数多く取り組んでいたが、当時、私がそこで唯一の統計 学者で、抱えていた問題やそれらの私の「解答」を誰かに相談する必要があった。
ファイザーで働いていて気づいたのは、独りでもできるような科学研究は実に少ないというこ とだった"たいていは誰かと意見を交わすことが必要となる。なぜなら独りではミスを犯しやす いからである。問題解決の手段として、ある数学公式を立てても、ときにそのモデルがふさわし くなかったり、さもなければその状況に合わない仮定を置いているかもしれなかったり、私の見 つけた「解答」が方程式の誤りに気づかずに得られたものかもしれなかったり、計算間違いをし でかしているかもしれないからだ。
スミス教授と話し合うためにストアーズにある大学を訪ねたり、あるいはファイザーで化学者 や薬学者と議論を交えるときは、私が彼らに疑問を投げかけるとたいてい歓迎された。彼らはこ うした討論に熱中し、また関心を持つて応じてくれた。科学者を研究に惹きつけてやまないのは、 たいてい問題追究を通じて得られる刺激にある。彼らは、問題を検討し、またそれを理解しよう とせんがために他者とのやりとりを楽しみにしているのである。
『実験計画法』
そう、それでケンブリッジの夏の午後の話だ。このヴァンダイク髭の男はロナルド.エイルマ 1-フイッシャー(Ronald Aylmer Fisher)といい、当時、ニー十代後半であつた。彼はのちにナ イトの称号を受け、ロナルド.フイッシャー卿となつた。一九三五年に『実験計画法(TTie bes^-nof Experiments)』という本を著し、その第二章でかの婦人が紅茶を飲む実験について 記している。
フイッシャーは仮説検定問題として、婦人とその意見を識論している。彼女が淹れ方の違いを 判別できるという決定を下すにはどのような実験を計画すればいいだろうか。彼はさまざまな方 法を考え出した。
実験を削画するうえで問題となるのは、彼女がカップを一つだけ手にして違いを判別できなか つたとしても、それがどちらの紅茶であるかを.止しく言い当てる確率は五0%なのだ。ではもし彼女にカップをニつ/:11したとしたら'正しく言い当てないとも限らない"それどころか、彼女が ニつのカップはそれぞれ別の淹れ方をした紅茶だと知っていれば、完璧に言い当てるかもしれな い(あるいは完全に外れもする)。
同様に、もし彼女が違いをぽ別できたとしても、間違う可能性はある。カップの一つがよく混 ざっていなかったり、ぬるめの紅茶だったりしたらどうだろう"彼女が違いを判別できたとして も、正しく見分けられるのは 一?のカップのうち九つだけかもしれないのだ。
フイッシャーは『実験計画法』のなかで、そのような実験で導き出されるさまざまな結果を検 討している。カップの数、出す順序、またどの程度まで実験のやり方を婦人に伝えるかといつた ことをどのように決めるべきか述べている。彼は、婦人が正しいか否かによって異なる結果が導 き出される確率を計算した。その本の検討では、その実験がその後どう進行したかには触れてい ない。また、実際の実験の結末も書かれてはいない。
フイッシャーが著した実験計画の本は、ニ〇世紀前半の科学全分野に変革をもたらす礎とな った。フイッシャIのはるか前から何百年にもわたって科学実験は行われていた。一六世紀の終 わりには、イギリス人のゥイリアム.ハーベイ(??Harvey)医師が動物実験を行っている。 静脈あるいは動脈を結紮し血液の循環を調べようとしたものであり、心臓から送り出された血液 は肺へと流れ、また心臓に戻り、体内を巡ってふたたび心臓へと戻ることを突き止めた。
フイッシャーは知識を増す方法として実験法を発見したわけではなかった。フイッシャ?以前 の実験とは科学者ごとにまちまちだった。優れた科学者は新たな知識を生み出すような実験を組み立てることができた。さほどでもない科学者は、デー夕を蓄積してはいくものの、知識を増す には役に立たない「実験らしきもの」に没入していることがしばしばであった。この好例が一九 世紀末に光の速さを計測しようとして、その多.くが結論のでない試みに終わったことである。ア メリ力の物理学者アルバート-マイケルソン(AlbertMichelson)が光に対して鏡を用いるきわ めて高度な一連の実験を行って、初めて良好な推定ができるようになった。
一九世紀ごろは、科学者が実験結果をありのまま発表することなどめったになかった。その代 わり結論を述べ、その結論が正しいことを「立証する」データを掲載した。グレゴール■メンデ ル(GregcrMendel)はエンドゥ豆を交配したすべての実験結果を示したわけではない。一連の 実験を記述したあとに彼はこう述べている。「実験の双方の組から最初の一O個が例示に役に立
つだろう 」(一九四〇年代にフイッシャーはメンデルの例示したデータを検証し、データが
真実であるにしては出来すぎていることに気づいた。あり得べきランダム性が見当たらなかった のである0
そもそも科学は入念な思考から観察、実験へと発展してきたが、いかに実験を進めるべきか明 確に示されることはこれまでなかったし、また完全な実験結果が読者に提供されることもそうそ うなかった。
とりわけ一九世紀末からニo世紀初頭の農学研究にこうしたことがH立った。フイッシャーが Mo世紀初めに勤務していたイギリス.口ザムステッド農事試験場は、彼が着任する前のほぼ九 〇年にわたって異なる肥料成分(いわゆる「人工肥料」)を用いた実験を行ってきた。代表的な実験は、まず畑全体に窒素とリン酸を混ぜた肥料を施し、そこで?類を育てて収穫≫;を測り、同 時に夏場の総降水量を計測するというものだった。各年各畑の生産量を「調整する」ために用い る精巧な公式があり、他の畑との生産量や、同じ畑の違う年のそれとを比較するのに使われた。 これは「肥沃指数」と呼ばれ、どこの農事試験場でも独自の指数を算出し、他所のものより正確 であると信じていた。
こうした九〇年もの実験結果は乱雑に入り混じっており、ただ莫大なだけの公にもされず役に も立たないデー夕の集積にすぎなかった。もし' いくつかの系統の小麦が他系統のものよりある 種の施肥で効果があったように思えても、それはただの多雨の影響だったのではないだろうか。 また他の実験では、ある年には硫酸カリを、翌年には硫酸ソーダを施肥したところ、ある種のジ ャガイモには増収をもたらしたが他種ではそうはならなかつたらしい。これら人工肥料について いえることは、そのうちのどれかがときどき、ひよつとすると、まあたぶん効果をもたらしたの であろうというぐらいのことだ。
フィッシャーは高度な数学知識をもってして、各年の天候のいかんによる違いを解き明かすべ く、ロザムステッドで農学者たちが結果を修正するのに用いた肥沃指数を考察した。さらに競合 する他の農事試験場で得られた指数についても検討した。単純な代数で変形していくと、いずれ も同じ公式を変形したものにすぎなかった。言い換えると、各支持者は頑として譲らなかったが」 ニつの指数は実のところまさに同じ補正をしていただけだったのだ。
一九二一年、フィッシャーは農学誌をリードする応用生物学論集上に論文を発表し、それまで使用されてきた指数に差は認められないことを一.小した。同時 にこの論文は、異なる畑での肥沃度の違いを調整するにはこれらの補正では不十分であると結論 づけた。この優れた論文が注3を集め、二?年以上におよぶ科学論争は終結した。
フイッシャーはさらに先の九〇年分の降水量と穀物収穫量のデータを洗い直し、年々の天候の 違いによる影響は肥料の違いによる影響よりも大きいことを一小した。のちにフイッシャーが実験 計画論のなかで発展させた言葉を使えば、天候の年ごとの違いと人H肥料の年ごとの違いは「交 絡してレる」のである(これはつまりこう^^た実験力ら得られたテー夕を用いる場合はデータ をバラバラに分けてはならないということを表している。九o年にわたる実験結果とそれを議論 したニo年以上の科学論争は、ほとんどすベて無駄な努力だったのだ!
こうした経緯かフイッシャーを実験そのものや実験計?について考えさせるきっかけをつく ったのである。彼が>'した結論は、科学者はさきざきの実験結果を数学モデルにすることから研 究を進めなければならないというものであった。数学モデルは方程式の集合体であり、そのなか である記号は実験から得られるデータの数値を表し、他の記号はその実験.の全体的な結果を表し ている。科学者は実験デ?夕からスタートし、考えている科学問題に見合ったやり方で結果を計 算する。
ある教師と一人の特定の生徒について聞いた話から思いついた簡単な例を一つ挙げてみよう。 この教師は子供の学習量を測定する方法を見つけることに関心を持っている。この目的のために、 教師は?供に対してある一群のテストをして「実験」を行う。どのテストも一〇〇点満点評価である。どのテストも一つだけでは子供の知識程度を推測するには頼りない。というのも、子供が テス卜に出たところをあまり勉強せすテストに出なかつたことについてはよ^知つている力も しれないからだ。テストの:1!に頭が痛かったのかもしれないし、テスト当日の朝まで両親と一ーー0い 争いをしていたのかもしれない。こうした多くの理由から、一つのテストでは知識程度の妥当な 推測を与えてはくれない。そこで教師は一組のテストを実施する。すべてのテストの点数から算 出した平均点が子供の知識程度のより妥当な推定をもたらす。ここでは子供の知識程度が結果で あり、個々のテストの点数がデータというわけだ。
では、教師はどのようにテストを構成すればいいだろうか。一連のテストは過去ニR間に教え た事柄だけを盛り込めばいいのか。今まで教えたすべてのことからいくつかまんべんなく出題す べきか。毎週あるいは?日テストを行うか、教えた単元の終わりごとにテストを行うか。これら すべてが実験計画に伴って生じる疑問だ。
農学者がある人;?,肥料の小麦生育に及ぼす効果について知りたいなら、実験はその効果を推定 できるデータが得られるように構成されていなければならない。フィッシャーは実験計^の第一 段階は、収集デー夕と予測される結果とのあいだの関係を物語るような一組の方程式を立てるこ とだと示した。そしてどんな有用な実験も、結果の推定ができるものでなくてはならない。実験 は特定化されていなければならず、また、科学者が結果の差異を、天候による結果なのか、異な る肥料を用いたことによる結果なのか、判別できるようにしなければならない。特に、同Iの実 験では、すべての実験処理を比較するために「コントロール」と呼ばれる対照実験区をもうける必要がある。
『実験計画法』のなかでフイッシャーはいくつかの優れた実験計画を例示し、そのための一般的 なルールを導き出した。し力しながら、フイッシャ1の手法で用いられる数学はとてつもなく複 雑で、たいていの科学者はフイッシャーが著した計画バターンの一つをなぞるしかなく、独自の 劃'?を生み^:iすことはできなかった。
農学者たちはフイッシャーの実験計画の優れた価値を認め、たいていの英語圏の農学校ではま たたく間にフイッシャーの手法が定着した。フイッシャーの初期の研究から離陸し、科学論文全 体が異なる実験計画を記述できるまでに飛躍した。これらは農学分野以外の医学や化学から産業 品質管理にいたるまで広範に適用された"多くの場合、用いる数学は難解かつ複雑であった。し かし当面のところ、科学者が避けては通れない考え方とr実験」のところで立ち止まることにし ょう。じっくりと慎重な思考が不可欠であり、それはしばしば難解な数学という強い薬を飲むこ とでもある。
さて力の紅茶の婦人であるかその後どうなったのだろうか?フイッシャーはそのまばゆ いケンブリッジの夏の午後の実験がどうなったかについては書き残してはいない。しかし、スミ ス教授から聞いたところにょると婦人はとれも;つ残らず正確に言い当てたそうである。人間の考え方の幾多の革命と同様に、統計モデルの概念が科学の一部となった確かな時期を特 定するのは難しい。ある人は一九世紀初めにドィツ、フランスで活躍した数学者の仕事にその具 体例を見,1:11すかもしれないし、ー七世紀の優れた天文学者ョハネス.ヶフラー(,1〇1\3111108 Kepler)の論文にそのヒントを見つけることもできる。
本書の「まえがき」で述べたが、天文学において統計の問題を説明するために、ラプラスは誤 差関数を考え出した。私ならむしろヵール-ピアソン(Karlpearson)がー八九o年代になした 業績をもって、統計革命の時期としたほぅがふさわしいと思ぅ。チャールズ■ダーゥィン 011目163 031^\5-)は^物学的な変異を生物の基本的な特徴として認め、それが適者生存といぅ 彼の理論の基盤となった。だが統計モデルの根底にある性質をいち早く認め、それが一九世紀の科学の時計仕掛けの世界という決定論的な見方とは異なる何かを提供することを認識したのは、 彼の仲間のイギリス人、力ール.ピアソンである。
私が一九六〇年代に数理統計学を学び始めたころは、授業でピアソンに触れることなど、めっ たになかった。その分野の大物と会って話をする機会があっても、ピアソン自身や彼の研究が引 き合いに出されることはなかった。彼は無視されるか、彼のしたことは時代遅れでしかない小物 として扱われるかのどちらかだった。
たとえば、アメリカ商務省標準局出身のチャーチル-アイゼンハート(churchiussenhart) は、ピアソンが?年にユ二バーシティ?カレッジ■ロンドンs^mt^fmj^MmM-t^f ぼ^tsleね〕で教えていたころの学生の一人である。アイゼンハートの記憶に よると、ビアソンは覇気のない老いぼれであった。統計学研究の進展のスピードはピアソンを吹 き飛ばし、やる気を殺ぎ、彼の業績の多.くは過去というゴミ箱行きになった。ユニバーシティ- カレ ッジの聡明な若い学生らは、 新たな大物たち ??そのなかには力ール*ピアソンの息子も含 まれていた??のもとで研究しようと群がった。しかし、新しくエキサイティングな研究の賑わ いとはかけ離れた独りぼっちの研究室に、年老いた力ールを訪ねてくるものは誰一人としていな かった。
ずっとこうだったわけではない。一八七o年代、若き力ール(carl)■ピアソンはイギリスを 離れ、ドイツの大学院で政治学を学んだ。ドイツで彼は力ール.マルクス(KarlMarx)の研究 に夢中になった。マルクスに心酔して、自分の名前の綴りをKarl(力ール)に変えたのではないかと言われている。
政治学のきちんとした本をニ冊書き、政治学の博士号を取得してロンドンに戻った。そのころ のィギリスは堅苦しいヴィクトリア朝の最中にありながら、彼は大胆にも背年男女議論クラブを 組織した。クラブでは、若い男女が(付き添いなしで)一緒に集まり、ドィツやフランス社会の 上流階級のサロンを手本に男女平^一寸を信念とした。
そこで彼らは世界の大きな政治的.哲学的問題を議論した。ピアソンがこの環境で妻と出会っ たという事実から、クラブ設立の動機は一つだけではなかったのかもしれない。この小さな社会 的挑戦から、ピアソンの独創的精神と、確立した伝統を徹底的に無視する姿勢がうかがえる。
ピアソンの博士号は政治学だったが、彼の主な関心は科学哲学と数学的モデルの本質にあった。
一八八〇年代に彼は『科学概論(The Grammar ofcccience)』を出版し、版を重ねた。第一次大 戦前のかなりのあいだ、この本は科学と数学の本質に閲する名著の一つに数えられていた。卓越 した独創性のある洞察に溢れており、科学哲学の重要な研究の一つになっている。そればかりか、 誰もが手を伸ばしやすいょうに、流暢かつ簡潔なスタィルでも書かれている。
『科学概論』を読んで理解するには、数学を知っている必要はない。本書を執筆している時点で 『科学概論』は一〇0年以上も前の本ではあるが、そのなかに見られる洞察や考え方はM一世紀 の数学研究にもかなり通じるものであり、今日でも遜色なく科学の本質の理解として的を射た内 容である。
ゴールトン生物測定研究所
ピアソンは生涯のこの時期に、ィギリスの科学者フランシス■ゴールトン卿(sir Francis Galton)の影響を受けていた。ゴールトンの名前を聞いたことのある人の多くは、彼を指紋の 「発見者」として知っていよう。ゴールトンの功績といえば、指紋が個人ごとに異なっているこ とを認識し、指紋を分類し特定化するのに通常使われる方法を具体化したことである。指紋が異 なるのは、指紋のバターンに不規則な点や切れ目があるためで、これらを「ゴールトンの点」と 呼んでいる。
ゴールトンの功績はそれだけではない。経済的に自立して裕福だった彼は、数のパターンの研 究を通して生物学に数学的な厳密さを追求しようとした科学愛好家の一人であった。彼が最初に 調?したものの一つは、?才の遺伝に関するものだ。知能が高いと評判の父子を探し、情報を収 集した。だが彼は、それはとてつもない難題であることに気づいた。というのも肖時、知能を測 る適当な尺度がなかったからである"そこで彼は身長のようにより簡単に計測できる形質の遺伝 を考察することにした。
ゴールトンはロンドンに生物測定(biometrical: bioは生物学rbioogy」から、metricは測定 「measurement」からとった)のための研究所をつくり"測定に協力してくれる家族を募集した。 その生物測定研究所で、家族の身長、体重、特定の骨の測定値やその他の特性を収集した',' 彼と助手はこれらのデータを表にし、検討に検討を重ねた。
ゴールトンは、親の測{疋値から子供のそれを予測する方法を探していた。たとえば傾向として、 親の背が高ければ、その子供の背が高くなることは明らかだった。しかし、親の身長だけから子 供の身長がどのくらいかを予測する数学公式はあるのだろうか?
相関と回帰
こうしてゴールトンは「平均へのM掃」と彼が名づけた現象を発見した。父親の背がとても高 いと息子は父親より低くなり、父親の背がとても低いと息子は父親より高くなる傾向があること を見つけたのだ。あたかもヒトの身長には' 両極の値からすべてのヒトから求めた平均値へと動 かす神秘的な力が働いているかのようだった'」
「平均への回帰」という現象は、ヒトの身長以外にも当てはまる。ほとんどすベての科学的観測 値は平均への?帰に取りつかれている。どのようにして尺.八.フィッシャーがゴールトンの平 均への_帰を、今の経済学や医学研究、そしてエ学のほとんどで、モ:流となっている統計的モデル へと変えることかできたのかを本書の第5章と第7章で見てゆくことにしよう。
ゴールトンはこの注EIすべき発見について考え、このことが真でなくてはならず、またすベて を観測する前にこのことを予測できたに違いないことに気づいた。平均への回帰が起こらないと 考えてみよう、と彼は言った。そうすると、背の高い父親の息子は、平均すると父親と同程度の背の高さとなる。この場含、何人かの息子たちは(背の低い人たちの分を相殺するために)自分 の父親より背が高くなければならない。また、息子世代で背の高かった人の子供たちの身長を平 均すると、何人かはさらに高いことになる"これが代々続いていくであろう。同様に、父親より 背の低い息子も何人かいるだろうし、何人かの孫、曾孫はいっそう背が低くなるだろう。比較的 近い何世代かあとには、一方でかなり背の高い人々がいるかと思えば、もう一方でかなり背の低 い人々がいることになろう。
だが、こうしたことは実際には起こらない。ヒトの身長の平均は、概して安定している傾?に ある。そうなるのは、非常に背の高い父親の息子が平均をとると背がより低くなり、非常に背の 低い父親の息子が平均をとると背がより高くなる場合のみである。平均への回帰は、安定性を保 ち、ある特定の種が代々ほとんど「同じ」ままである現象なのである。
ゴールトンはこの関係性を測る数学的尺度を発見し、それを「相関係数」と名づけた。ゴール トンは生物測{疋研究所で収集したデー夕から、この数値を計算するための独自の公式をつくった。 それは平均への回帰をある一面から測る、きわめて独特な公式だが、その現象を引き起こした原 因について何一つ教えてくれるわけではない。ゴールトンはこの意味で相関という言葉を初めて 使ったのである。それ以来'この言葉はー般]|-]語となった。
相関は、ゴールトンの相関係数よりもっとあいまいな何かを指すのによく使われる"その響き は科学的に聞こえるが、科学者以外の人々はしばしば、あたかもニつの物事がどれくらい関係性 があるかを表しているかのような物言いに用いる"しかし、たとえゴールトンが意図した意味で相関という言葉を使ったとしても、ゴールトンの数学的尺度として断らない限り、正確でも科学 的でもない。
分布と母数
ゴールトンは相関を定式化することで、この新しい革命的な考え方にとても近づいた。そして その結果、ニ?世紀におけるほとんどすべての科学が、部分的に修正を施さざるを得なくなった のである。しかし、それをさらにほぼ完全なかたちにまで定式化した最初の人物こそ、彼の弟子 のカール■ピアソンだつた。
この革命的な考え方を理解するには、科学全般についての先入観を捨てなくてはならない。科 学とは測定することである、とよく教えられる。注意深く測定して、本質を説明する数学公式を 見つけるためにその測定値を使うのだ。
高校の物理学では、時間とその間に落下する物体の移動距離の関係は記号「g」を含む公式で 表されると教えられる。ここで「S」は、加速度定数を表す。実験で「g」の値が求められると も教えられる。そして、高校生は一連の実験を行う"斜面に小さなおもりを転がし、斜面上のい くつかの場所に到達する時間を計測するのだ。すると、いったい何が起きるだろうか?
正答が得られることはめったにない。生徙が実験を重ねるにつれて混乱が生じるだけで、実験 のたびに「g」の値は異なってしまうのだ。教師はその卓越した知識から見下して、生徒に正しい答えが得られないのは、彼らがいい加減であったり、注意不足や正しくない数値を書き写した ことが原因ではないと断言する。
すべての実験がいい加減であり、とても注意深い科学者でも正しい数値を得ることはきわめて 稀だ、と教師が生徒に言うことはない。実験ごとに予測も観測もできない誤差が生じるからであ る"部屋の空気が暖まりすぎているのかもしれないし、おもりが転がり始める前の 一o〇万分の 一秒間くっついて離れなかったのかもしれない。蝶が飛ぶことで生じる微風が影響を与えるのか もしれない。実験から実際に得られる数値は散らばっており、そのなかの一つが正しいのではな く、正しい値にできるだけ近い推定値を得るためにすベてのデ!夕を用いることができるのであ る。
ピアソンの革命的な考え方で武装すると、われわれは実験結果が生来、慎重に測定された数値 であるとは見なさない。それどころか散らばりのある数値例、もっとわかりやすくいえば' 数値 の分布として見ている。この数値の分布は、数学公式で表現できる。それは観測された数値があ る特定の値となる確率を表すものだ。
とある実験で実際に得られる数値がどうなるかは予測できない。われわれに言えるのは、その 値になる確率であって、値の確実性ではない。個々の実験結果は、予測不可能という意味でラン ダムである。しかし、分布の統計モデルではそのランダム性の数学的性質を表すことができるのだ。
科学において、観測値にランダム性がつきものであることを理解するには時間がかかった。
一八世紀から一九世紀にかけて天文学者や物理学者は、許容できる精度まで観測値を表現できる数 学公式をうち立てた。測定機器が某本的に正確ではなかったから、観測値と予測値のあいだに乖 離があることは予想されたが、それは無視された。惑?や他の天体は運動の基本式によって決定 される正確な軌道に従うと考えられていたからである。不確実性は下手な計測によるもので、_ 然が本来持っているものではないと思われていたのだ。
物理学におけるこれまでにないより精緻な測定機器の発展によって、またこの測定の科学を生 物学や社会学へ広げようとする試みによって、自然が本来持っているランダム性がいっそう明ら かになった。このランダム性をどのように扱えばよいだろうか。
Iつの方法は、精緻な数学公式はそのままにしておき、観測値と予測値のあいだの乖離を小さ く重要でない誤差(6ロ0こと見なすことだった"実際、早くもー八ニ〇年にラプラスは自らの 数学論文で最初の確率分布を著した。それは、これらの小さく重要でない誤差が起きる確率を数 学的に定式化した誤差分布であった。この誤差分布は「べル型|:01線」ないし正規分布と呼ばれ、 一般用語の仲間入りをした。
こ、っいつたことは、ピアソンを正規分^または誤差分布のさらに一歩先へと進めることになつ た。生物学の蓄積デー夕を見て、ピアソンは、誤差は測定によるものというより、むしろ観測値 そのものが確率分布を持っていることに気づいた。われわれの測定するものが何であろうと、実 際にはそれはランダムな散らばりの一部分であり、その確率は分布関数という数学上の関数で表 現される。ピアソンは分布関数の族を発見し、自ら「歪んだ分布(sivewdistTibutions)」と名づ.けた。彼の主張によれば、それは科学者がデータ上から兒出すだろうと思われるあらゆるタイプ の散らばりを表現できた。この族の各分布は四つの数値で識別される。
分布関数を識別する数値は、観測値と同じタイプの「数値」ではない。これらの数値は決して 観測できないが、観測値の散らばり方から推測できる。これらの数値は「観測値に匹敵するも の」を意味するギリシャ語から母数と呼ばれるようになった。ビアソンの分布族を完全に表現 できる母数は次の四つである。
1平均??観測値の散らばりの中心値
2標準偏差^大多数の観測値の散らばりがどれほど平均から離れているか 3対称性??平均を中心として片側だけに観測値が偏っている程度 4尖度??平均から離れて稀に観測される値の散らばりがどれほど平均から離れているか
ピアソンの歪んだ分布族の登場で考え方にわずかながらシフトが起きた"ピアソン以前は、科 学が扱ってきた「こと」は実在し知覚できた。ケプラーは、惑星が宇宙でどのように運行するか を表現する数学法則を発見しようとしていた。ゥイリアム‘ハーヴヱイの実#は、ある特定の動 物の血液が動静脈をどのように流れてゆくかを見つけようとしていた。化学は元素そのものと元 素の化合物を扱った。しかし、ケプラーが飼いならそうとしたr惑星」は、実際には数学の集ま りで、地球上の観測者に見える大空の輝く光の位置を特定するものであった。ある一頭の馬の静脈を流れる厳密な血液のルートは、ほかの?や特定のヒトに観測されるであろうものとは異なっ ていた。鉄が元素の一つであることはわかっているが、誰一人として純粋なかたちで鉄の標本を つくることはできない。
ピアソンは、これらの観測できる現象は偶然の産物にすぎないと提案した。実在するものは確 率分布であった。科学でいう実在する「こと」とは観測したり触れられるものではなく、観測で きるもののランダム性を表わせる数学関数だったのである。分布の四つの母数は、科学的解明の うえでわれわれが本^に決定したいと望んでいることである。だがある意味で、これら四つの母 数を実際に法めることは決してできない。データから推定することができるだけである。
ピアソンはこの最後のところを認識しそこなった。十分なデータが集められれば、母数の推定 量が母数の真値になると信じていたのだ。ピアソンの推定法の多くが最適でないと指摘したのは、 彼の若きライバル、ロナルド■フイッシャーだった。一九三〇年代後半、ピアソンが人生の終わ りを迎えたころ、若く聰明なポーランド人数学者イェジー?ネイマン(Jerzy Neyman)は、ピ アソンの歪んだ分相族が存在しうる分布の世界を包括しておらず、ピアソンの分布族では多くの 重要な問題を解明できないことを示した。
だが、年老いて見捨てられた一九三四年の力ール*ピアソンはひとまず脇に置いて、発見した 歪んだ分布に熱中していた三十代後半の精力的なピアソンに話を戻そう。一八九七年にロンドン のゴールトン生物測定研究所を引き継ぎ、ゴールトンが人体測定で蓄積してきたデータについて 分布の母数を計算するために大勢の若い女性たち(「計算機」と呼ばれた)を動員した。ニ〇世紀に入るころ、ゴールトン、ピアソン、ラフアエル' ウェルドン(Raphael v^eldon)は力を合わ せ、ピアソンの考え方を生物学のデータに応用する新しい科学学術誌の創刊に尽力した。コール トンは自分の財産を費やし、この新雑誌の援助財団を設立した。その創刊号で、編集者たちは意 欲的な構想を表明したのである"
バイオメトリ力誌の構想.
ゴールトン、ピアソン、ウヱルドンは元気のよい科学者グループの一翼を担い、最も著名なイ ギリスの科学者の一人、チャールズ‘ダーウインの洞察を広めていた。ダーウインの進化論とは、 生物は環境上のストレスに反応して変異するというものである。ダfウインは、環境変化は新し い環境により適した(生物の)ランダムな変化が生じることに、多少とも利点を与えると主張し た。やがて環境が変化するにつれて、また生物がランダムな突然変異を起こすにつれて、新たな 環境で生存-生殖に適応する新種が誕生する。この考え方は「適者生存」として知られている。 無知な政治学者がこれを社会生活に当てはめ、富をめぐる経済的な争いの勝者は貧困にあえぐ A々よりもよく適応していると主張して、社会に悪影響をもたらした。適者生存は、過激な資本 主義を正当化し、富める者が貧しき者を無視してもかまわないという道徳的な根拠を与えたので ある。
生物学では、ダーウインの考え方はかなり強固であるように思われた。ダーウインは、現存の種が出現してくる前の種を連想させるものとして、関連する種のあいだの類似性を指摘した。ま た、種が若干異なる小鳥や、孤立した島々に生息する小鳥が解剖学的共通項を持っていることを 示した。さらに異なる種のあいだの胚の類似性も指摘した。そのなかには(発生時に尾を有す る)ヒトの胎児も含まれた。
ダーウィンが示せなかったことの一つは、人類の歴史の時間内に実際に発生した新しい種の例 である。ダーウィンは適者生存によって新種が発生すると説いたが、この証明はなされなかった。 彼が示したのは、現在種のすべてはその環境によく「適応」したように見えるということだ。
ダーウインの提案は周知の事実を裏つけるように思えたし、人を惹きつける論理構造を備えて もいた。だが、古いイディッシユ語〔ilflx^ll^Mッ〕のことわざにあるように「例は証明では ない」のだ。
ピアソン、ゴールトン、ウヱルドンはこの欠如を修正するために新しい科学雑誌を創刊した。 確率分布として現実を捉えるというピアソンの見方では"ダーウィンの(自著で重要な例として 使った)フィンチ【viKllvトUが科学的調杏の対象にはならなかった。ある一種すベてのフィンチ のランダムな分布が対象だった。すべてのフインチのくちばしの長さを測定できたなら、そのく ちばしの長さの分布関数は独自の四つの母数を持ち、それら四つの母数はその種のくちばしの長 さを特徴づけるだろう。
ある特定のランダムな突然変異に対して優れた生存力を与え、所与の種を変化させるような環 境的影響力が存在すると考えてみよう、とピアソンは言った。新しく誕生した種と出会えるほどわれわれは長く生きられないけれど、分布の四つの母数の変化を見ることはできるだろう"学術 誌の創刊号で、三人の編集者は世界中からデータを収集し' そのデータの分布の四つの母数を特 .足すると表明し、その結果、環境変化に伴う母数のシフトの例を示せると期待していた。
彼らはその新しい学術誌を「バイオメトリ力(Bs-metri/ca)」と名づけた。その雑誌はゴール トンが設立したバイオメトリ力財団から潤沢な財政支援を受け、創刊号にはフルカラーの写真や 複雑な図にはグラシンべーパー〔7P',---33IUを折り込めるほどだった。高品質のラグべー パー〔5巧|'R14KSMEUに印刷され、たとえ数式がきわめて複雑で組み版に費用がかかって も、そのまま載せられたし
最初のニ五年間にわたってバイオメトリ力誌に掲載されたのは、アフリカのジャングルに入っ て原住民の脛骨と腓骨を測定したデータ、中央アメリカの熱帯雨林で捕獲したエキゾチックな熱 帯の鳥のくちばしの長さのデータ、古代の墓地からヒトの頭蓋骨を掘りおこし、狩獵用の散弾を 詰め込んで頭蓋容量を測定したデータなどであった。一九一〇年にこの雑誌は計測棒に対して平 らな地面に横たわったピグミー民族の男性の縮んだ陰茎のフルカラー写真を何枚も掲載した" 一九二一年、若い女性の連絡担当委員(correspondent)だったジュリア■ベル(Julia Bell) は、アルバニア軍の新規兵の身体測定をしてデー夕を得ょうとしたときのトラブルについて書い ている。彼女は助手となるドイツ語を話す将校が見つかると保証されて、ウイーンからアルバニ ア辺境の前哨基地に向かった。基地に到着すると、ドイツ語の単語を三つだけ話せる軍曹が一人 いるだけだった。彼女は挫けずに青銅の物差しを出し、彼女の望むょうに腕を上げたり脚を開くまでくすぐることで' 青年たちに何をしたいかをわからせようとしたのである。
これらのデータセットのそれぞれについて、ピアソンと彼の計算機(の女性)たちは分布の四 つの母数を計算した。論文では最もぴったり^てはまる分布のグラフが描かれ、この分布と他の 関連デー夕がどの程度異なっているかについての論評が載った。
今にして思うと、こうしたすべての活動がダーゥィン理論の証明にどのように役立ったかを知 ることは難しい。バイオメトリ力誌のこれらの号を読み通してみて、まもなく計測自体が目的と なり所与のテータセットは母数を推定する以外の実質的な意味を持たなくなってしまったとい う印象を抱いた。
雑誌には他の論文も時おり載っている。そのいくつかは数学理論を使い、確率分布の発展に伴 って生じた問題を扱っていた。たとぇば一九〇八年に、:人の無名の研究者が「ステユーデン トJというペンネームで、ほとんどすべての現代科学研究に影響を与ぇる「ステユーデント」の セ検定の結果を生み出した。あとの章でこの匿名の著者について1れ、ヵール.ピアソンとロナ ルド■フィッシャーのあいだを取り持つこととなった不幸な役割について議論しよう。
コールトンは一九一一年に亡くなり、ゥェルドンはそれ以前にアルフスでスキー事故のために 亡くなっていた。ピアソンはバイオメトリ力誌のただ一人の編集者として、また財団資金の唯一 の分配者として残された。それからのニ?年は雑誌をわが物のように扱い、ピアソンが重要だと 思ったものは掲載され、そうでないと思ったものは掲載されなかった。また、雑誌はピアソンの 論説で埋められた。
彼の豊かな想像力はありとあらゆることに及んでいる。古いアィルランドの教会の改修で壁か ら骨が発見されたが、ピアソンは実際にそれがとある中世の聖人の骨かどうかを特定するために 数学的推論と骨についての計測値を用いた。その発?された頭蓋骨は、オリバー?クロムウHル olver Cromwell)のものであると言われている。ピアソンはこれを調べて、とてもおもしろい 論文にまとめあげた。そのなかでクロムウェルの死体に降りかかった既知の運命を記すとともに、 クnムウHルの肖像画の計測値と頭蓋骨のそれとを比較した。ピアソンは他の論文で、王の在 位期間の長さや古代ローマの貴族階級の没落を調べ、社会学、政治学、植物学など数学的に複雑 な体裁を持つものすベてに手を出している"
死の直前、力ール*ピアソンは「ユダヤ人 異邦人関係について(0!1^乱311-0611£6
Relationshipsごと題した短い論文を発表した。そのなかで、世界のあらゆる地域のユダヤ人と 異邦人についての身体測定データを分析した"正式名称を社会国家主義者とするナチスが唱える 人種理論はまったくのナンセンスであり、ユダヤ人種だからどうだということもなければ、さら に言うと、アーリア人種とてどうだとも言えないと結論づけた。この最後の論文は、明快かつ論 理的で注意深く説明がなされており、彼の以前の研究の伝統を踏みはずすことなく見事な出来映 えを保っている。
ピアソンはほとんどの人が通常、科学の範疇とは考えない人間の思考の多くの分野を研究する ために数学を用いた。バィオメトリ力誌の彼の論説を読み通すと、非常に幅広いことに関心を持 ち、問題の核心を突き、それに取り組む数学モデルを見出すことのできる非凡な才能を持った人
物像が浮かび上がってくる。またそれは同時に、部下や学生を彼自身の意志の延長と見てしまう、 強い意志を持つたとても頑固な人間と出会うことでもある。私は力ール■ピアソンとともに:!!々 を過ごせたらどんなに楽しかっただろうと思う.??もし異見がなかったら、ではあるが。
彼らは適者生存を通じてダーゥインの進化論を証明したといえるのだろうか? おそらく証明 したのである。古代の墓地の頭盖骨から得た頭蓋容量と現代の男女の頭蓋容量との分布を比較す ることで、人類は何千年にもわたって目を見張るほど安定していることをなんとか証明したのだ。 アボリジニの身体測定値がminッバ人の身体測定値と同じ分布であることを示し、アポリジニ がヒトではないという一部の才hストラリア人の主張が誤りであることを証明した。
この研究から、ピアソンは「適合度検定」として知られる基本統計手法を開発し、それは現代 科学に不可欠な手法となった。この手法のおかげで' 所与の観測データセットにとって特定の数 学的な分布関数が妥当かどうかを科学者が決められるようになった。第10章で、ピアソンの息子 がこの適合度検定を使って、父親が成し遂げてきた研究の多くを、いかにして密かに批判したか を見てゆくことにしよう。
ニ〇世紀も進むと、バイオメトリ力誌には数理統計学の理論的な問題を扱った論文がますます 多くなり、特定のデータの分亦を扱った論文はほとんど見当たらなくなった。力ール.ピアソン の息子エゴン■ピアソンが編集者になると、完全に数学理論へ移行した。現在バイオメトリ力誌 はその分野で卓越した雑誌の!つになっている。
架たして、ピアソンたちは適者生存を証明したのだろうか。その証明に最も近づいたのはニo世紀初めだった。ウヱルドンはある壮大な実験を思いついた":八世紀のイングランド南部で陶 器工場の発展により、複数の河川が粘土の沈泥で塞がれるようになった。よってプリマスやダー トマスの港は、海に近いところよりも港の内部に、より沈泥が溜まるようになった。ウX.ルドン はこれらの港から数百四のヵニを捕獲し、ー匹ずつガラス瓶のなかに入れた。半数の瓶には港内 部の沈泥が混じった水を入れ、残りの半数の瓶には港の外側から採取したよりきれいな水を入れ た。そして彼は一定期間生存した力ニの甲羅を測定し、きれいな水で生存した力ニと沈泥の混じ った水で生存した力ニのMつの分布の母数を求めた"
ダーウインが予測したのとまったく同様に、沈泥の混じった水で生き残った力ニの甲羅の分布 には母数の変化が生じていた!これは進化論を証明したことになるのだろうか?残念ながら、 ウェルドンは実験結果を書き上げる前に亡くなってしまった。ピアソンはこの実験とデータの予 備的な分析の結果をまとめたが、最終的な分析はついに行われなかった。この実験の財政支援を したイギリス政府は最終報告書を求めたが、提出されることはなかった。ウェルドンは亡くなり' その実験も終わったのだ。
結局、ダーウインの理論はバクテリアやショウジョウバエのような生存期問が短い種に対して は正しいことが証明された。これらの種を使えば、科学者は短期間に何千?代もの実験を行うこ とができた。遺伝学の基礎である現代のDNA研究は、種のあいだの関係についてさらに強固な 事実をもたらしている。突然変異の起こる割合が一千万年以上も前から変わらないと仮定すれば、 DN A研究は霊長類と他の哺乳類の種が誕生する時間枠を推定するのに川いることができる。最短でも、それは 一o万年かかることになる。
今日、大多数の科学者はダーウインの進化メカニズムを正しいものとして受け入れている。あ らゆる既知のデータとこれほどまで適合する他の理論的メカ一一ズムは一つとして提案されていな い。科学は満たされ' 短期間に進化が起きたことを示すために分布の母数のシフトが必要である という考えは姿を消した。
ピアソンの革命が残したものは、科学の対象となる「こと」は観測可能ではなく、観測値に伴 う確率を記述する数学的な分布関数であるという考え方である。今日の医学研究では、長期生存 のための治療の予想される効果を求めるにあたって、分布の巧妙な数学的モデルを使う。社会学 者や経済学者は人間社会の行動を記述するために数学的分布を用いる。量子力学の形成にょって、 物理学者は素粒子を記述するために数学的分布を用いる。科学のどの側面もこの革命から逃れら れないのだ。
一部の科学者たちは、確率分布の使用はI時的なその場限りの解決法にすぎず、最終的には一 九世紀科学の決定論主義に戻る方法を見つけられると主張している。「神はサイコロを振り賜わ ず」というアインシュタインの有名な言葉は、そのょうな見方の一例である。他の人々は、自然 は基本的にランダムであり、ただ一つの真理は分布関数のなかにあると信じている。人々の基に なっている哲学の違いにかかわらず、ピアソンの分布関数と母数の考え方がニ〇世紀科学を席捲 し、:ニ世紀への変わりCEに勝利を収めたという事実に変わりはない"
アィルランドはダブリンの老舗で誉れ高いギネスビール醸造会社は、ニ〇世紀が幕を開けたと 同時に科学への投資を始めた。若きギネス卿(Lord Guinness)は会社を継いでまだまもなく" オックスフォード大学やケンブリッジ大学で化学を専攻した最先端の卒業生を雇い入れ、会社に 近代的な科学技術の粋を導入した。
ウィリアム.シーリー■ゴセット(wimamseaiyGosset)がギネス社に採用されたのは一八九 九年のことだった。当時彼は二三歳、オックスフォード大学で化学と数学の学位をとって一竿業し たばかりであった"ゴセットの数学的素養は微積分学、微分方程式、天文学から、ほかにも時計 仕掛けの宇宙観に基づく科学の見地を含む、当時の伝統的なものであった。まだ力ール■ピアソ ンの革新やのちに'a子^学となるものは大学のカリキュラムに導入されていな力つた。
第^章かの親憂なるゴセット氏は、化学の専門的知識を買われて採用されたが、さて、ビール醸造会社で数学者としてどんな 使い道があったのだろうか。
ギネス社にとって、ゴセットへの投資は大正解だった。ゴセット自身有能な管理者としての働 きを見せ、実際に、大nンドン市の事業全体を管理するまでに出世した。だが実は、ビール醸造 の技術に対して彼が最初に大きく貢献したのは数学者としてだった。
ゴセットが雇用される数年前にも、産業界では草分け的に数学者を雇い入れた企業があるには あった。そこでは明らかに数学を必要とする問題が存在した。たとえばそのIつであるデンマー クの電話会社では、電話交換台にはどれくらいの大きさが必要かという問題を抱えていたのであ る。では、ビールやエール(ビールの一種)を製造する会社のいったいどこに、数学上の問題が 存在したのだろうか。
一九〇四年にゴセットが初めて発表した論文はそのことを扱っている"ビール製造過程で麦芽 汁を発酵させるために用いる酵母は、精密に計量する必要があった。酵母は生きており、麦芽汁 に投入するまで培養液の瓶のなかで増殖しつづける。この作業に従事する人たちは酵母液をどれ だけ投入するかを決めるために、所与の瓶のなかにある酵母の数を計測しなければならなかつた。 そのため液中から標本をとり、顕微鏡で見えた酵母細胞の数をかぞえるのだ"そのような測定は 果たしてどの程度正確なのだろうか。変芽汁に入れる酵母の数は注意深く管理しなくてはならな いので、測定の精度を知ることはきわめて大切であった。酵母が少なすぎると十分に?酵しない し、多すぎると苦いビールになるからだ1
これがどのようにしてピアソンの科学へのアプローチと一致するのかに触れておこう。ここで の測定は標本中の酵母細胞を数えることだが、本当に求めていた「こと」は、瓶のなかの酵母細 胞の濃度だった。酵母は生きものなので細胞は絶えず増殖■分裂するため、この求めたい「こ と」は?実には存在しない。ある意味で存在するのは、一単位当たりの酵母細胞の確率分布であ る。ゴセットはデータを?べ、酵母細胞の数が「ポアソン分布」として知られる確率分^でモデ ル化できると考えた。これはピアソンの歪んだ分布族の一つではない。実はポアソン分布は母 数が(四つではなく) Iつしかない独特の分布なのである。
標本中の生きた酵母細胞の数がポアソン分布に従ゝっものとして、ゴセットは酵母細胞の濃度を より止雍に評価するための測定ルールや方法を考案することができた。そして、このゴセットの 方法を使って、ギネス社はより安定した品質の製品を生産できるようになったのである。
「ステユーデント」の誕生
ゴセットはこの結果をしかるべき学術雑誌に発表したいと考えていた。ポアソン分布(または その数式)は一〇〇年以上も前から知られており、実生活でその事例を見つけだす試みがずっと なされていた。そのーつには、プロシアの陸軍で馬に獄られて死亡した丘ハ士の数を計測したもの まである。酵母細胞を数えるにあたってゴセットは、そこに統計分布という新しい考え方を導入 し、その重要な応用となる明快な事例を得た。
しかし、従業員に研究発表を認めるのは会社の方針に反していた。数年前に、ギネス社のある ビール醸造責任者が、ビール醸造の一工程について秘密の部分を明かす論文を執筆していたのだ。 そのような貴重な会社資産がさらに流出するのを防ぐために、ギネス社は従業員に印刷物での発 表を禁止した。
ゴセットは、当時バィオメトリ力誌の編集者の一人である力ール■ピアソンと親密になった。 ピアソンはゴセットの優れた数学の才能に目をかけた。一九〇六年にゴセットは、ビール会社で も新しい数学的な発想が役立つと社長を説得し、ゴールトン生物測定研究室のピアソンのもとで 研究するために一年間の休暇をとった。このニ年前、ゴセットが酵母を扱ったことから得た結果 をまとめあげたとき、ピアソンは自分の雑誌にゴセットの論文を掲載したがった。そこで彼らは その論文を発表するにあたってペンネームを使うことにした。このゴセットの最初の発見は、単 に「ステユーデント」と名乗る者によって発表されたのであった。
以後三〇年以上にわたって、rステユーデント」は一連のきわめて重要な論文を書き、そのほ とんどすベてがバィオメトリ力誌に掲載された。ギネス家が、「親愛なるゴセット氏」が会社の 方針に反して秘密裏に科学論文を書き、発表していたことに気づいたのは後年になってからであ る。「ステユーデント」の数学的な仕事の多くは通常の勤務時間のあと、自宅に戻ってから行わ れており会Rでコセットかより責任を伴うような地位へと出世した事実力ら考えるとギネス 社はゴセットの職務外の活動によって悪影響を受けなかったようだ。出所ははっきりしないが、 ギネス家がゴセットの活動を知ったのは、ゴセットが一九三七年に心臓発作で急死したときのことらしい。数学研究上の友人がゴセットの死後、彼の論文集を一冊の本にまとめる際に印刷費用 の援助を求めてギネス家に接触して明らかになった、という話である。
この話の真偽はともかく、アメリカ人の統計学者ハロルド.ホテリング(ffiarosEotelling) が:九三o年代末に「ステユーデント」と会って話がしたいと思った際、秘密裏に彼と会う手? が整えられ、すべてがさながらスパイ.ミステリーのようだった、と回顧している。このことは、 「ステユーデント」の正体がギネス社に露呈していなかったことを示している。ゴセットは実用 本位の問題には関心を失って、解洪が必要な現実問題は他の人に任せて手を引き、難解な数学的 定式化へとのめり込んだので' バイオメトリ力誌に掲載された「ステユーデント」の論文は、理 論と応用の先端に位置することになったのである。
そんな偉業を残したにもかかわらず、ゴセットは謙虚な人であった。彼の手紙には、「私の研 究は物事の大雑把な考え方(を与えた)にすぎない」といった表現が見られるし、「フイッシャ hが本当に苦労して完全な数学問題を解き明かした」ときには、発見に寄与していても著者や貢 献者として名前を公表しようとしなかった。
ゴセットは、他人の気持ちを敏感に察し、親切で思慮深い同僚として人々の記憶に残っている。 彼が六一歳でこの世を去ったとき、妻のマジョリー(彼女ははつらつとしたスポーッ選手で、か つてイギリス女子ホッケーチームのキャプテンを務めていた)のほかに、息子ひとりと娘ふたり、 そして孫が残った。加えて彼の両親もまだ存命だった。
「ステューデント」のt検定
ほかのことはともかく、すべての科学者がゴセットの「平均についての起こりうる誤差」とい うタイトルの短い論文の恩恵を受けている"その論文は一九o八年にバイオメトリ力誌に発表さ れた。この注目すべき論文の一般的な含意を指摘したのは、ロナルド-エイルマー.フイッシャ hだった。
ゴセットには解くべき特定の問題があった。彼は夜になると自宅で、持ち前の忍耐強さと注意 深さでその問題に取り組んだ。ある解がaつかると、ほかのデー夕で調べ、結果を再検証し、R 細な差異がないかどうかを確{疋しょうと努め、どんな仮定を置くべきか熟考し、発見したことを 計算し"また再計算した。ゴセットは現代のコンピュータによるモンテカルロ法を先取りした。 この手法は、数学モデルに沿った確率分亦を決定するために、その数学モデルを何度も何度もシ ミュレートするというものだ。しかし、彼にはコンピュータがなかつた。彼は慎重に数を合剖し、 何百もの例から平均をとり、得た頻度(度数)を作閲した"それもすベて手作業で。
ゴセットが取り組んだ特定の問題は、小標本を扱っていた。力ール■ピアソンは一つの分布か ら数千もの測定を累積して、分布の四つの母数を計算した。ピアソンは大標本を扱っていたため、 得られた母数の推定値は正しいと仮定した。のちにピアソンが誤っていたことを証明することに なつたのはフイッシャーであつた。 .
ゴセットの経験によれば、科学者がそのような太標本を扱える贅沢はほとんどなく、むしろ一 実験から得られる観測値は一〇からニ〇程度にすぎない。そのうえゴセットは、こうしたことが 科学全般に当てはまると認識していた。ビアソンに宛てた手紙の一つにゴゼットはこう書いてい る。一もし^のようにあまりにもサイ、スが小さな標本で仕寧をしている人間をほかに見たことが ないと■-iたらあなたはとても恵まれて,> る。|/がストラットン〔ケンフリッシ大学のフエロ 1〕と知り合ったのはこの問題がきっかけであった……(ケンブリッジで)ストラツトンはなん と標本サイズが四のデー夕を例として使ったのだ!」
ピアソンのすべての研究は' 標本サイズがとても大きかったので母数を誤差なしで決定できる と仮定していた。一方ゴセットは、もし標本サイズが小さいときに何が起きるかを問題としてい たのである。では、計算に必ず紛れ込んでいるランダム誤差を"どのように扱うことができるだ ろうか。
コセットは夜に合所のテーフルに座って標本サイ、スが小さいデータセットをとりその平均と 推定した標準偏差の両方を調べると前者を後者で割り、その結果をグラフ?紙にプロットした。 そして四つの母数がこの比と関連していること、また、ピアソンの歪んだ分布族の一つと適合し ていることを突き止めた。この大きな発見のおかげで、もとの分布の四つの母数すべてについて 正確な値を知る手間が省けるようになった。最初の二つの母数の推定値の比についての確率分布 を表にすることができた。データがとられた場所がどこかとか、標準偏差の真の値が何であるか は重要ではなくなった。これら1:つの標本推定値の比をとると、既知の分布に従うことがわかったのである。
フレデリック.モステラー(Fredericksosteller)やジョン.テユ一キ一(John Tukey)が指 摘したように、この発見がなかったら、統計分析は無限退行していく運命であった。のちに「ス テユーデント」のtと呼ばれるこの発見がなければ、分析者は観測デー夕の四つの母数を推定し、 そのあと四つの母数の推定値のさらに四つの母数を推定し、その後またその推{疋値の四つの母数 を推定するとい、っ作業を延々としなければならなかっただろう。最終的な計算に到達することな ど不可能だったのである。ゴセットは、分析者が推定を第一段階でやめられることを示したので ある。
ゴセットの研究には基本的な仮定があった。そもそもの観測データは正規分布に従うと仮定し たのだ。長年、科学者たちが「ステユーデント」のtを使用するにつれて、この仮定が必要なか ったと信じられるようになった。もとの観測デ一タが正規分布に従うかどうかにかかわらず、 「ステユーデント」のtが同じ分布を持つことを科学者たちはしばしば発見したのである。一九 六七年にスタンフォード大学のブラッドリー■エフロン(Bradley Efron)がこの正当性を証明 した。より正確には、エフロンはゴセットの仮定が必要ない一般条件を発見したのである。
「ステユーデント」のtの開発によって、われわれは科学に広まった統計分布理論を使うように なつたが、それは深い哲学的問題をはらんでいる。すなわち「版説検定」とか「有意性検定」と 呼ばれる手法を使うことである。これについてはあとの章で明らかにする。今のところは、「ス テユーデント」が、ほぼ誰もが使、っ^たとえ本当に理解している人がほとんどいなかったとしても!?科学的ツールを提供したことを記すにとどめておこう。
とかくするうち、「親愛なるゴセット氏」は大立物で反nrしあう二人の天才、ヵール■ピアソ ンとロナルド■エイルマー.フイッシャーとのあいだを取り持つよ、っになつた。ゴセットはよく ピアソンにフイッシャーが書いてよこすものはよくわヵらないと患痴をこぼしていたガこの 二人と親密な関係を維持した。
ゴセットとフイッシャーの関係は、フイッシャーがまだケンブリッジの学部生のころからのも のだった。フイッシャーの天文学のチユjターが二人を紹介したのは一九一二年のことで、フイ ッシャーはケンブリッジ大学の数学優等卒業試験のラングラー(一級合格者)になったところだ った。フイッシャーは天文学の問題を考察していて「ステユーデント」の一九〇八年の結果と同 じ発見をして論文を書いた。このとき若きフイッシャーは、ゴセットの過去の研究の存在など知 るよしもな力つた。
その論文でフイッシャーは、ゴセットが犯した些細な間違いを指摘した。ゴセットが帰宅する と、ニぺージにわたる詳細な数式がフイッシャーから届いていた。その若者は、ゴセットの原研 究をやり直し、拡張し、ゴセットが犯した間違いを特定していた。ゴセットはピアソンに手紙を 書き、「(「ステユーデント」のtの)頻度分布の数式を証明した手紙を同封します。……これを 見ていただけるでしょうか。ほかの点では理解できたとしても、三次元以上になると自信があり ません……」。フイッシャーはゴセットの結果を、多.次元幾何学をJJJいて証明していたのである。
その手紙のなかでゴセットは、ケンブリッジへ行ったおり、ゴンヴイル*アンド*キーズ-力レッジでフイッシヤーのチユータjをしていた友人に会い、まだーニー歳の学生だったフイッシヤ ?を紹介されたいきさつを述べている。彼はこう続けている。「フイッシヤーという学生は、『確 率の新たな基準』とか、そのようなものについての論文を書いています。簡潔ですが、私が理解 した限りでは、まったく実際的ではなく、役にも立たないものの見方です」
ケンブリッジでのフイッシヤーとの議論について語ったあと、ゴセットは次のように書いてい る0
このことについて、フイッシヤーは証明したことを、最も性質の悪い数学で埋めつくされ たフールスキヤップ判ニぺージにわたって答えてきました。(このあとに数式が続く)::: 私はその内容を理解できませんでした。そして時間があれば勉強するつもりであるという返 事を書いて送りました。実際、湖水地方まで持っていったのですが、……失くしてしまった グてす!
たった今、彼はこれを私に送ってきました。もし問題がなければ、この証明を研究ノート として掲載するほうが好ましいかもしれません。これは大変出来がよく、かなり数学的でも あるので、ある種の人々にはアピールするかもしれません。
こうしてニo世紀の偉大な天才の一人が彗星のごとく現れたのである。ピアソンはこの若者の 研究ノートをバイオメトリ力誌に掲載した。三年後、かなり恩着せがましい手紙のやりとりが続いたあとで、ピアソンはフイッシャーのニ本目の論文を掲載した。だがそれは、ピアソンの共同 研究者の一人にょって行われた研究のさして重要でない補遺と見なせることを確認したあとのこ とだつた。ピアソンはフイッシヤーの他の論文をバイオメトリ力に決して掲載させなかつた。フ イッシヤーは、ピアソンが誇りにしている多くの成果の間違いを探しつづけたのである。ピアソ ンの編集したバイオメトリ力誌のその後の号では、他の学術雑誌に掲載された「フイッシャー 氏」や「フイッシヤー氏の弟子」にょる論文の間違いについてしばしば肯及されている。このす ベてが次章のネタになっている。ゴセットはこれ以降、いくつかの章でふたたび登場する。温和 な指導者としてゴセットは、男女を問わず若者に統計分布の新しい世界を紹介するべく力を注い だ。彼の学生や共同研究者の多くはこの新しい数学に大きな貢献をした。控えめな主張にもかか わらず、ゴセットが行った数多くの貢献はあとあと永く寄年しつづけたのである。
ロナルド-エイルマー■フイッシャーが妻と三人の子供と義理の姉とともにロンドンの北にあ るロザムステッド農事試験場に隣接した古い農家に移り住んだのは、;九一九年の春、ニ九歳の ときのことだった。どう考えても、彼は人生の敗北者だった。ひどく眼の悪い、病弱で孤独な子 供として成長した。近視が進まないようにと、医師は人工光のもとで本を読むことを禁じた。彼 は幼いころから数学や天文学に興味を持った。六歳にして天文学のとりこになり、七、八歳で有 名な天文学者ロバート*ボール卿(sirRobertBaBの評判の講義を受けるほどだった。
フイッシャーは有名なパブリックスクールであるハロー校に入学し、そこで数学で優れた才能 を発揮した"電灯の使用が許されていなかったので、数学のチユーターは日が暮れると、紙や鉛 筆、そのほか眼を使うものに一切頼ることなく彼の指導にあたった。その結果、フイッシャーは
第^章 厩肥の山を調べ上げる
幾何学のセンスを深めるに至った。後年、その並々ならぬ幾何学的洞察力を持って、難解な数理 統計学の問題を解き明かした。しかし、彼にはわかりきったことだつたので、ぅまくほかの人に 理解させることができなかった。ほかの数学者は' フイッシャーにとって明らかなことを証明す るのに数力月から数年を要することさえあつた。
一九?九年にケンブリッジ大学に入学したフイッシャーは、一九二一年には名声あるラングラ 1(一級合格者)の称号を掌中にした。ケンブリッジの学生のなかでも、I連のきわめて難しい 数学の試験を口頭と筆記の両方で合格した者だけがラングラーとなる。これは一年に一人かニ人 しか成し得ないことで、ラングラーがいない年もあつた。
まだ学部学生だったころ、フイッシャIは最初の科学論文を発表し、そこで複雑なくり返し公 式を多次元幾何空間にょって解釈している。それまで非常に複雑だった計算方法がその幾何学に ょつて簡単になることを、この論文で証明している。学士終了後もさらに一年在学し、統計力学 と量子論を学んだ。一九二ニ年までに統計軍命は物理学にも及び、これら一:つの分野は新しい考 え方がぅまく浸透して系統化され、正規の教科となった。
フイッシャーが最初に就いた職は投資会社の統計事務所だったが、彼はヵナダで農業をするた めに突然辞めた。だが、第一次世界大戦が始まったころ、また突如農業を辞めてイギリスに舞い 戻った。軍隊から召集がかかったものの、視力が悪かったので兵役を免れた。戦争中はパブリッ クスクールを転々としながら数学を教えていたが、学校を替わるたびに^々しい経験を重ねた。 彼は、自分にとって明白なことを学生が理解できないでいると、無性に腹が立ったのである。
フイッシヤー対力ール’ピアソン
まだ学部学生のころ、フイッシヤーの書いた研究ノートがバイオメトリ力誌に掲載されたこと は前章で述べた。それがフイッシャーと力ール.ピアソンの出会いだった。
ピアソンはフイッシャIにゴールトンの相関係数の統計分布を決定せょといぅ難題を持ち込ん だ。フイッシャーはその問題を検討し、幾何学の公式に当てはめて計算し' わずか一週間で完全 な解答を出した。フイッシャーはそれを投稿してバイオメトリ力誌への掲載を求めたが、ピアソ ンはその算出法を理解できなかった。そこでその解答をゴセットに送ったが、ゴセットにもまた 理解しづらいものだった。
ピアソンは特定のケースでその問題に対する解答の一部を得る方法を?んだ。その方法は途方 もない量の計算が必要で、生物測定研究莖の職員まで駆り出された。どの場合でも、ょりー般的 なフイッシヤIの解答と一致した。それでもなお、ビアソンはフイッシャーの論文を掲載しなか つた。ピアソンはフイッシヤーに論文をもつと具体的にするょぅ促した。ピアソンは一年以卜に わたってフイッシャーを寄せつけず、その間にさまざまな母数の値ごとに、とても詳細な分^表 を助手たち(「計算機」)に計算させた。
最後には、ピアソンはフイッシャーの研究を公表したが、彼と助手の一人がこの表を載せた長 大な論文に添えた脚注扱いだった。その結果、何も事情を知らない読者にしてみれば、フイッシャーの巧妙な数学的導出は、ピアソンとその協力者にょるより重要で大がかりな計算作業の単な る付録にすぎなかつた。
この分野の卓越した学術誌のバイオメトリ力誌にそれ以後、フイッシャーの論文が載ることは なかった。翌年以降の彼の論文は、農業科学雑誌(Joma0/^g3.cwauraco2.§'ce)や272e Quarterly Journal oj the Ro ゼ alivleteorolo ぬ ical Society,T"he Proceedings of the lioyal Society oj Egrs'&sパ9S-および^roceefzinCQs o/^ecoocie?o/psycMCa7t-uesearcs-などの雑誌に掲載された。
これらの雑誌は一つとして、いつも数学研究と結びついているわけではない。フイッシャーを 知る者によれば、これらの雑誌を選んだのは、ピアソンやその友人らが事実上フイッシャーを数 学研究および統計研究の主流からうまく締め出したためらしい。またほかの人によれば、ピアソ ンの尊大な態度や、同じような論文を王立統計学会誌(Jcmmazq^ぎ^0c£.5Ya3-.良ca; soctf;p :統計学分野で権威のある学術誌)に発表してしまったことがもとですっかり拒絶され たとフイッシャーは感じていたようだ。そのためフイッシャjはほかの雑誌に論文を投稿するし かなく、ときには掲載料を支払つてまで論文を掲載してもらうことさえあつた。
「フアシスト」フイッシャー
R - A ■フイッシャーの論文のうち、初期のいくつかは数学的色合いが濃い。ピアソンが結局 発表を許した相関係数の論文は、数学的表記で溢れている。それが顕著なベージでは半分もしくはそれ以上が数式で埋まっているほどだ"
しかし、数式がまったく?れない論文もある。その一つは、ダーウインにょるランダム適応の 理論が、最も洗練された解剖学的構造を説明するのに適していることを論じたものである。
もう一つは、性的嗜好の進化を推測したものだ。フイッシャーは優生学を支持する運動に参加 し、一九一七年には「知的職業階級と高度に熟練した職人間の出生率を上げ」かつ下層階級の出 産を奨励しないという一枚3石の国家政策を呼びかけ、優生学レヴユI (Bugfenics Jies.ew)誌に 論説を発表した。
この論文で、中流階級が将来の経済的懸念から?婚化と家族制限を行う一方で、貧困層への政 府の福祉政策はその階層の出生率を高め、結果として次世代に彼らの遺伝子を伝えることになる と主張した。フイッシャーが恐れた最終的な結果は、国家が将来の世代として「最劣の」遺伝子 を選び、「優良」遺伝子を除外するというものである。血統を選ぶことで人類の遺伝子を蓄積- 改良しょうという運動である優生学の論点は、フイッシャーの政治的な考えの大部分を占めてい た。第二次大戦中、彼はファシストであると誤って告発され、戦争に関するあらゆる活動に就く ことができなかった。
フイッシャーの政治姿勢はピアソンとは対照的だった。ピアソンは社会主義とマルクス主義に 興味半分に手を出し、虐げられた人に同情し、保身的な「上流」階級に異議を唱えるのを好んだ。 ピアソンは自らの政治的な考えが科学研究に影響を与えることはなかったが、フイッシャーの優 生学への関心は遺伝学の数学に彼を傾倒させることになった。植物や動物の特定の形質がたった一つの遺伝子に起因しているという(当時において)新しい概念から始まり、それは対になった 染色体の片方で起きてもよいのだが、隣り合った遺伝子が互いに及ぼす効果を推定する方法を示 すことで、フイッシャーはグレゴール* メンデルの研究を拡張していったのである。
生命体の性質を左右する遺伝子があるという考え方は、科学の統計革命全体の一部をなしてい る。「表現型」と呼ばれる動植物の特徴を観察する際に、われわれは、ある仮定をおいている。 それは、表現型の動植物は相互作用が起きる確率が異なる遺伝子同士のあいだでの相互作用の結 果である、という仮定である。われわれはこれらの潜在的で目には見えない遺伝子レべルから表 現型の分布を記述しようとしている。
ニ〇世紀末には生物学者はこれら遺伝子の物理的特質が遺伝をつかさどる分子の切片、すなわ ちDNAであることを突き止めた。細胞に指令を^一してどんなタンハク質を合成する力を決める これらの遺伝子を解読できるようになり、これが実際に起きていることとして話す"しかし、わ れわれが目にしていることは依然としてさまざまな可能性の一つにすぎず、遺伝子と呼ぶDNA の切片はそのような可能件ヵらもたらされたものである。
さて、本書は統計革命全般を扱っており、その重要な一役をR - A *フイッシャーは担ってい る。フイッシャーは遺伝学者としての業績を自負し、研究成果のおよそ半分は遺伝学を扱ってい た。遺伝学者としてのフイッシャーの話はここまでにして、これ以降は主に彼の統計全般の方法 や考え方の発展を見ていくことにしよう。これらの考え方の萌芽は初期の論文に見られるが、ロ ザムステッドで働いていた一九二〇年代から三o年代初めに、より飛躍的な発展を遂げた。
『研究者のための統計的方法』
フイッシャーは当時、数学界から無視されていたが、農学や生物学分野の研究者には多大な影 響を及ぼすょうな論文や本を発表していた。:九ニ五年、彼は『研究者のための統計的方法 (statistical Methods Jdr Jiesearch fvor/srs)』の初版を出した。この本は、英語版で一四版を重 ねたほか、フランス語、ドイツ語、イタリア語、日本語、スペイン語、ロシア語に翻訳された。
『研究者のための統計的方法』はそれ以前に出版された他の数学書とは違っていた。たいてい数 学の本といえば、定理やその定理の証明がずらりと並び、抽象的な概念を展開してそれを一般化 したり、他の抽象的な概念へ関連させていくものである。そのょうな本には応用があったとして も、数学が十分に記述され証明されたあとになる"
『研究者のための統計的方法』は数値からグラフを作成する方法、ならびにそのグラフの解釈の しかたを検討するところから始まる。三ぺージめに、新生児の体重を生後ニー;週間にわたって毎 週計測した最初の例がある。その新生児とはフイッシャーの長男、ジョージである。続く章では データの分析方法として、公式を与え、実例を示し、その例の結果を解釈して他の公式へと進め ていく手順を記述している"どの公式も数学的な導出は書かれていない"すべてにおいて、正当 な理由づけや証明は省かれている。それらは機械式の計算機でどうやるのか詳細な方法が紹介さ れているが、証明はない。
数学理論が欠けているにもかかわらず、いや、もしかするとそれゆえに、この本が科学界に溶 け込むのにそう時間はかからなかった'」それは待望の一冊だった。必要最低限の数学しか学んで いないような研究所の技術屋たちの手に渡ると、非常に重宝がられた。科学者たちはフィッシャ hの所説は正しいと判断した。一方、それを批評する数学者たちは、証明もなしに?々しい記述 だと胡散臭げにこの本を扱い、いったい彼がどうやってこれらの結論に達したのか怪しんだ。
第二次大戦中、スゥ工ーデン人の数学者ハラルド.クラメール(Harald Cram6r)は戦争によ つて国際的な刹学コミュニティ^?^らK立してしまい来る日も来る日もフイツシャーのこの本 や論文を読み返し、証明の欠けている部分を理め、どこにも示されていない証明を引き出した。
一九四五年にクラメールは著書『統計学の数学的方法(Ma^ema??.caMesods o/^afis?.cs)』 を発表し、フィッシャーが書いたことの火部分を正式に証明した。だが、彼は才気あふれる天才 フィッシャーの仕事のisrを選んたにすぎず、フィッシャーが#いたことのすベてをこの本で扱 うことはできなかった。しかしそれでも、クラメールの本は新世代の数学者や統計学者を教える ために用いられ、彼によるフィツシャーの要約は標準のパラダイムとなつた。
一九七O年代にイェール大学のL ■ _^一.サヴェッジ(L. J.savage)はフィッシャーのオリシナ ルと照らし合わせ、クラメールがどれほど証明を省略したのかを明らかにした"フィツシャーが のちにほかの人が扱った研究を先取りし、一九七〇年代でも未解決とされていた問題を解明して いたことを知つてサヴHツジは呆気にとられた。
しかし' フィッシャーの業績が正当に評価されるのはまだまだ先のことで、一九一九^a時にはフイッシャーは教員として成功しているとはいえない経歴に諦めを漂わせていた"彼はちよぅ ど記念碑的研究を終えたばかりだった。相関係数とメンデルの遺伝の法則についての遺伝子論を 結びつけたのである。その論文は王立統計学会とバイオメトリ力誌のピアソンのどちらにも掲載 を断られた。フイッシャIは、エジンバラ王立協会がTyamaaions誌上に載せる論文を探して いると聞きつけたが、執筆者には掲載料の支払いが求められた。このよぅにして、フイッシャー の優れた数学的研究は無名の雑誌にお金まで支払って掲載されたのである。
この時点で、力ール*ピアソンはまだ若いフイッシャーに感銘を受けており、ゴールトン生物 測定研究室の主任統計学者として採用したいと申し出た。二人の文通は心がこもっていたが、明 らかにピアソンは頑固で威圧的だった。フイッシャーの主任統計学者としての役割はせいぜいピ アソンに命令された細かい計算をさせられているにすぎなかった。
ロザムステッドと農事試験
フイッシャーにはロザムステッド農事試験場のジョン.ラッセル卿(SFJChnRussdl)からも 接触があった。ロザムステッド農事試験場は、イギリスの肥料メーヵーによって、かつてその肥 料会社のもともとの所有者が持っていた古い農場に設立された。粘土質の土壌はことさらどんな 植物の生育にも適していなかったが、その所有者は過リン酸塩として知られるものを製造するた めに、砕石と酸を結合させる方法を発見した。過リン酸塩の製造で儲けた利益で新しい人工肥料を開発すべく実験農場を設立したのである。
九〇年ものあいだ、そこで「実験」が行われ、異なる無機塩の組み合わせと異なる種の小麦、 ライ麦、大麦、ジャガイモの生育テストが行われた。これは莫大なデー夕の宝庫となり、正確な 毎日の降水量と気温、週ごとの施肥状況や土壌の測定記録、そして年ごとの収穫量の記録??そ のすべてが革表紙のノートに保存されていた。大多数の実験は一貫した結果をもたらさなかった が、ノートはずっと試験場の記録保管所に手厚く保管されていた。
ラッセル卿はこの膨大なデータの山を見て、誰かを雇ってこれらの記録を多少統計的に調べれ ば、たぶんそこにある何かを見極めることができるだろぅと確信した。周りの人々に聞いたとこ ろ、誰かがロナルド■エイルマー■フイッシャーを廳めた。ラッセル卿はフイッシャーに一年一 〇〇〇ポンドでの雇用を申し出た。彼にはそれ以上の申し出はできなかったし、この仕事が';年 以上続くかどぅかも保証できなかった。
フイッシャーはラッセルの申し出を呑んだ。そして妻と義理の姉と三人の子供を連れ、ロンド ン北部の農村部へ赴いた。農事試験場のすぐ隣に家を借り、妻と義姉は菜園の手入れをし、家事 を切り盛りした。フイッシャーは長靴をはいて畑を横切り、九〇年分のデータが待つロザムステ ッド試験場に通い、彼がのちに言ったところの「厩肥の山を調べ上げる」仕事に従事したのだつ た。
生物統計学者として駆け出しのころ、私は抱えていた問?を議論するためにコネチヵット大学 ストアーズ校へ通っていたが、あるときヒユー-スミス教授がプレゼントを用意してくれていた。
それは「収量変動の研究1 ロザムステッドの小麦収量に対する降雨の影響(studies in Crop
variation.m) Jといぅ論文のコピーだった。この論文は五三ぺージにも及んでいる。
この論文は卓越した数理統計学論文のシリーズの三作目であり、シリーズー作目が農業科学雑 誌 一I号に掲載されたのは一九二一年のことだった。収穫量の変動は実験科学者にとって悩みの タネであるが、統計手法の基本的な対象である。変動といぅ表現は現在の科学文献ではめったに 用いられず、「分散」のょぅな、分布の特定の母数を?す別な用語で?き換ぇられてきた。変動 は通常、科学で使用する言葉としてはあいまいすぎるが、この一連の論文には適当だった。とい
第^章「収量?動の研究」
ぅのも、この著者は年ごと、_場ごとの作物の収量変動を新しい分析手法の出発点にしていたか らである。
たいていの科学論文は、末尾に提大な参考文献を載せ、議論した問題を扱った先行論文を明ら かにする。このシリーズ一作目の「収量変動の研究1」では、参考文献はたったのー;::.:つだった" 一つは降雨と小麦の生育関係を表す試みが失敗したことを:不した一九〇七年の論文、一:つめは、 複雑な数式の最小値を計算する手法に関する一九〇九年の論文、そして三つめは、力ール.ピア ソンにょって出版された一群の数表だった。この卓越したシリーズで対象となった大多数のトビ ックを扱った論文など、過去に一つもなかったのだ。「収量変動の研究Jは他に類を見ない研究 であった。それらの著者名には、ハーペンデン、ロザムステッド農事試験場統計学研究室所属の 学術修士、R . A -フィッシヤー、と記されていた。
一九五〇年にジョン-ワイリー社はフィッシャーに、公刊した論文のなかから最重要なものを 選び出し、一冊の本にまとめないかと持ちかけた。『数理統計学への貢献(contributions to MaMemcUical sfaF-^ics )』といぅタイトルがつけられたその本を開くと、出版された^時の白 髪の尺,八.フィッシャーの写真がある"その写真のフイッシャーは、ロを真ー文字に結び、ネ クタイは少し曲がっていて、白い髭はあまり手入れされていなかった。そこには「ケンブリッジ 大学優生学科、R . A -フィッシャー」とある。「収量変動の研究I」はこの本の三番Hに収録 されている。その前ftきに、フィッシャーはこの論文の重要性と彼の研究における位置づけを表 す短い文を載せている。
著者がロザムステッドでの初期の仕事で注Uしたのは、長い歴史を誇るこの試験場に蓄積 されてきた気象、収穫量、収量分析などの膨大な記録だった。明らかにこれらには、気象上 の数字がどの程度まで収穫量の予測に役立つのかを確証する問題に対する、またとない価値 があった。この論文は、それに精力を注いだ一連の研究の最初のもので……。
「精力を注いだ一連の研究」は数のうえでは六本の論文があることになっている。「収量変動の 研究n」は一九二三年に発表された。一九二四年にはスミス教授が私にくれた論文「収量変動の 研究瓜」が出た。「収量変動の研究]\」はー九ニ七年に、「収量変動の研究\1」はー九ニ九年に公 刊された。このシリーズのVだけはフイッシャーの選集に収録されていない。
科学の歴史のうえでは、一連のタイトルがこれほど内容の重要性を示すキ?ヮードに乏しいも のはめずらしい。これらの論文でフイッシャーは、データを分析するための独自の手法を開発し、 それらの手法の数学的基礎を導き出し、他の分野へ拡張してみせ、さらにロザムステッドで見つ けた「厩肥」にその手法を応用した。
これらの論文は際立って独創性があり、理論研究者をニ?世紀の残りを多忙にさせつづけるだ けのわくわくするインプリケーションに満ちていた。そしておそらく今後もより多くの研究を触 発しつづけるだろう。
「収量変動の研究I」
フィッシャーの一連の研究において、あとのニつの論文には共著者がいる。「収量変動の研究 I」はフィッシャ11人で研究を行った。その研究は莫大な計算をしなければならなかった。唯 一の助けとなったのは、ミリオネアという名前の計算機で、基本的な計算しかできない手動式の 機械式計算機であった。たとえば、三三四ニXニ七という計算をするには、プラテンを一の位に おき、数字を一:一三四ニにセットしてハンドルを七同まわす。次にプラテンを十の位におき、数字 を一二三四ニにセットしてハンドルを一一回まわす"七桁の数字が扱えるほどプラテンが大きかった ため、ミリオネアと呼ばれたのである。
計算に費やした時間が実際どれぐらいのものか想像するために、「収量変動の研究I」の一二 三べージに出てくる表七を取り上げてみよう。もし、桁数の大きな乗算一つを行うのに一分程度 かかるとすると、この表を作成するために一八五時間を要したと推測できる。同程度に複雑な表 がー五個と、大きくかつ複雑なグラフが四つあるので、論文の図表を一人でこなすなら、一日一 ::::時間作業しても少なくとも八力月はかかったに違いない。これには数学理論を考えるために必 要な時間は含まれておらず"データをまとめ、分析を練り、避けられないミスを正す時間も含ま れていないのだ"
ゴ^?ルトンの平均への回帰を一般化する
ゴールトンの発見した平均への回帰と、ランダム事象を互いにリンクさせる数式を見つける試 みを思い出してほしい。フイッシャーはゴールトンの言葉でいぅ回帰を取り入れ、ある畑の小麦 収量と年の数学的関係を一般化した。ピアソンの確率分布の考え方は、今や年と収量を結びつけ る公式となった。このより複雑な分布の母数は、小麦収量の変化のさまざまな局面を表している。 フイッシャー並に数学を使いこなすには、微積分学の確かな知識、確率分布理論についてのセン スのよさ、多次元幾何学への感覚が欠かせない。だが、難しいからといって、フイッシャーの結 論を理解できないといぅわけではない。
フイッシャーは小宏収量の年次的変化の傾向をいくつかの様相に分解した。Iつめは土壌の悪 化による継続的な総収量の減少、一:つめはそれぞれの局面に数年かかる長期のゆっくりとした変 化、三つめは年ごとの気候の変動を考慮に入れた動きのやや速い変化である。フイッシャーが先 鞭をつけて以来、時系列統計解析はフイッシャIのアイデアや手法を土台にして築かれてきた。
今日、優れたアルゴリズムを使って膨大な計算をこなせるコンビユータがあるが、基本的な考 え方や手法はかつてと変わりない。時間を通じて変動しがちな数値が与えられれば、異なる要因 ごとの効果に分解できる。時系列解析はアメリヵの太平洋岸に押し寄せる波を分析するために使 われ、それによってインド洋の嵐を特定できるのである。これらの手法のおかげで、研究者が地下核実験と地震を区別することや、心拍リズムから的確な病理的区別を行うこと、環境規制の大 気への効果を数量化することなどが可能となった。そして、こ、っいった応用はどんどん増えてい る。
フイッシャーはブロードバルクという名の農地で収穫された小麦の分析に頭を痛めた。この農 地では自然の厩肥だけが使われてきたので、一部年の収量変動は実験で用いた肥料の影響ではなか った。そのため長期にわたる収穫量の低下は、厩肥では得られない栄養分が土壌から失われたと 考えられた"そして彼は年ごとの変化に対する降水量の違いによる影響を特定するのに成功した のだ"
では、ニつめのゆっくりとした緩慢な変化の原因は何なのであろうか。緩慢な変化のパターン は一八七六年に指摘されたが、収穫量は他の二つの影響から予測される以上に減少し始めていた。 一八八o年以降、収穫量の減少にますます拍車がかかった"一八九四年に改善に転じ、一九o一 年まで続いたが、その後また減少した。
フイッシャーは同じ緩慢な変化ではあるが反対のバターンを持つ異なる記録を見つけた。これ は小?畑に蔓延する雑草である。一八七六年以降、雑草は新種の多年草植物に取って代わり、か つてないほど茂った。そしてー八九四年を境にその雑:\:は突然減ったが、|九〇ー年にふたたび 繁り始めた。
結局、一八七六年以前には、小麦畑の雑草を抜く幼い少年たちを雇っていたことがわかった。
_時' イギリスの畑で見られる午後のお決まりの風景といえば、子供たちが小麦や他の穀物をかき分け、雑草をくまなく抜くことにうんざりしている様子だった。一八七o年の初等教育法の制 定で、就学が義務化され、多くの幼い少年たちが小麦畑からいなくなった。て八八〇年、二番目 の教育法は、学校に行かせないままにしている家族に罰則を科し、ついに幼い少年たちは小麦畑 から姿を消した。雑草を抜く小さな指がなくなって、雑草が繁り始めたのだった。
では一八九四年には何が起こって、ふたたび雑草は減り始めたのだろう。ロザムステッドの近 くには全寮制の女子学校があった。新しい校長のジョン■ロゥズ卿(sir JohnLaws)の信条は身 体を丈夫にするために屋外の活動を積極的に行うことだった。彼は農事試験場の所長と話をつけ て、土曜日やタ方に幼い少女たちを畑へ速れていき、雑草を抜かせたのである。一九〇一年にロ ゥズ卿が亡くなると、幼い少女たちは動きの静かな屋内の活動に逆戻りしてしまった。そしてブ ロードバルクに雑草が戻ってきたのだ。
確率化対照実験
収量変動に関する111番目の研究も農業科学雑誌の一九二三年の号に掲載された。この論文では ロザムステッドの過去の実験によって蓄積されたデータを扱っていない。その代わりに、異なる 品種のジャガイモに施すさまざまな?料の組み合わせに関する一連の実験について記述している。 R .A .フイッシャーが着任してから、ロザムステッドでの実験に驚くべきことが起こった。あ る圃場いっぱいに一つの肥料を撒くような実験はもはやしなかった。フイッシャーたちは圃場を小区画に分割した。そしてそれぞれの小区画を列に分けて植物を植え、その小区画の列ごとに異 なる肥料を与えたのである。
基本的な考え方は単純である。単純??それはかつてフィッシャーが提案したことだった。こ れまでそのようなことを考えついた者は、誰一人としていなかった"小麦の圃場を見た誰にとっ ても、圃場の一部が他の部分と比べてよく生育していることは明らかだった。ある部分では植物 は高く成長し、重い穂をつけた。また他の部分では植物は細くて不揃いであった。その原因は水 はけによるためかもしれないし、土壤の変化によるためかもしれないし、未知の栄養素の存在に よるためかもしれない。多年性の雑草がかたまって生えていたからかもしれないし、他の予見で きない効果のためかもしれないのだ"
もし、農学者がニつの肥料成分による違いを試験したければ、圃場の片側にある肥料を、もう 片側に別の肥料を与えることもできよう。だが、これでは肥料の効果と土壌または排水の特性に よる効果を区別することができない。もし、試験が同じ圃場であっても異なる年に行われれば、 肥料の効果は年ごとの天候の変化と混同されてしまう。
そこで肥料を同じ年の隣のものと比較すれば、土壌の違いによる影響をできる限り抑えられる。 施肥を行った植物は厳密には同じ土壌の上では育っていないから、それでもまだ違いはあるだろ う。もしそのような対(ペア)をたくさん用いれば、土壤の違いによる差異はある程度平均化さ れるはずだ。仮に通常のニ倍のリンが含まれている肥料とそうでない肥料のニつを比較したいと しよう。圃場を小区画に分割し、それぞれの小区画に植物をニ列ずつ植える。いつも北側の列にリンの多い施肥をし、南側の列に別の施肥をする。
すると、誰かがこう言うかもしれない。もし土壤の肥沃度勾配が南北に走っているなら、平均 化できないでしょう、なぜなら各区画の北側の列は南側の列よりも若干よい土壌なのだから。
それではこうしよう。一番目の区画では、北側の列にリンの多い施肥をする。二番目の区画で は、南側の列に、など。読者のなかには大雑把な圃場の地図を書いて、リンの多い列を叉と書い て表す者もあるだろう。もし肥沃度勾配が北西から南東に向かって走っているのであれば、リン の多い施肥をした列は他の列よりすべてよい土壌となっていることを指摘するに違いない。肥沃 度勾配が北東から南西に向かって走っているのであれば、逆のことが成り立つと指摘する者もい るだろう。そう' 別の読者はそのどっちなのか、と知りたがるだろう。また、どのように肥沃度 勾配が走っているのかと。それに対してわれわれは誰も知らない、と答える。肥沃度勾配という 概念は抽象的なものである。肥沃度の実際のパターンは、南北とか東西というよりは複雑な形で 上下しているかもしれないのだ。
ロザムステッドの科学者のあいだでこういった議論が交わされていたときに、フイッシャーが 小区画内で設定する処理にはより入念な実験計画を考えなくてはならない、と指摘した様子がS に浮かぶようだ。肥沃度勾配をどうやって決定したものか、科学者たちの議論がますます深みに はまっていくかたわらで、フイッシャーは椅子にゆったり座って微笑んでいたのだろう。
彼はとっくにそれらの問題を考え、ある単純な答えを得ていた。彼は哇えていたパイプをとっ た。彼を知る人の表現.を借りれば、彼は座って静かにパイプをふかし、議論が白熱しているあいだじゅぅ、答えを差し挟むタイミングを待っていたのだ。彼はこぅ言った。「ランダム化〔確率 化〕しなさい」
フイッシャーの分散分析
それは単純である。科学者は区画内の異なる列への姐理(treatment)をランダムに割り当て るのだ。ランダム配列は固定的なパターンを生じさせないので、肥沃度勾配のいかなる構造も平 均をとると相殺されるのである。フイッシャーはやおら立ち上がると猛烈な勢いで黒板に書き 始めた。黒板を数式や記号で満たすや腕をせっせと動かして、数式の両辺で相殺できる要素に横 線を引いて消したところ、おそらく生物科学でただ一つの最重要ッールとなったものが現れた。 これは十分に計画された科学実験において、異なる処理の効果を分離する方法である。フイッシ ャーはこれを「分散分析」と呼んだ。「収量変動の研究n」で初めて分散分析が華々しく登場し た0
『研究者のための統計的方法』で分散分析の複数例の数式が示されたが、この論文では数学的に 導3dされている。ところが数学者を満足させるほど十分に細かくは求められていない。三種類の 肥料、ー0品種のジャガイモ、四1^画の土壤を比較する場合の公式は出ているが、ニ種類の肥料 と五品種のジャガイモの場合や六種類の肥料と一品種のみの場合に、この公式を適用する方法を 知るには数時間の辛抱強い作業が必要である。すべてのヶースに当てはまる一般公式を算出するには、額に汗して数式を解く以上のことが要るのだ。もちろん、フイッシャーは一般公式を知っ ていた。フイッシャーにしてみれば明らかなことだったので、それをあえて計算する必要性を感 じなかったのである。
若きフイッシャーの研究が同時代の人々を当惑させたとしてもなんら不思議ではない! 「収量変動の研究1\」では、フイッシャーが「共分散分析」と名づけたものを紹介している。こ れは実験計画の一部ではなく、存在し測定可能な状況の影響を析出する方法である。医学雑誌の 論文で「性差と体重が調整された」治療効果を示すときには' フイッシャーがこの論文で開発し た方法を用いる。研究^では実験計画法の理論が精微化されている。スミス教授が私に紹介した 研究^は本章の終わりで述ぺることにしょぅ。
自由度
一九ニニ年、フイッシャーは王立統計学会誌にょぅやく初めて論文を掲載することができた。 それは力ール-ピアソンの公式の:つが誤っていることを控えめに証明したシヨートノート(短 い論文)である。かなりあとに、フイッシャーはこの論文について次のょぅに書いている。
このシヨートノートは未熟な力量不足の点すべてを弓っくるめて、何らかの先鞭をつけ た。その暫定的かつ断片的な内容に苛立ちを感じた読者には、そもそもピアソンの研究には修正など必要ないと思っている査読者や、仮に修正が必要だと認めていたとしてもすでに自 ら修正してしまったと思っている音読者の目を経て、ようやく刊行に遭ぎつけたということ をおわかりいただきたい。
一九二四年にはフイッシャーは、王立統計学会誌に先の論文よりも長い一般的な論文を掲載す ることができた。彼はのちに王立統計学会誌とある経済誌に発表した関連論文についてコメント している。
「(これらの論文は)自由度という新しい概念を使って、著者によって結果が食い違ったり変則
的になったりするのを一致させる試みであり 」
「自由度という新しい概念」とはフイッシャーの発見であり' 彼の幾何学的な洞察力や多次元幾 何学を使った数学上の問題に転化する能力に直接結びついている。「変則的な結果」とはニユー ョークのT.L*ケリー (Tr.Keuey)という何者かによって出版された、世に埋もれてしまっ た一冊の本に出ているものである。ケリーはピアソンの公式のいくつかが正しい答えをもたらさ ないらしいという事実に気がついた"フイッシャーだけがケリーの本を調べたようだ。ケリーの 発見した変則的な結果は、フイッシャーがピアソンの最も誇りとした偉業の一つを完全に粉砕す る踏み台として使われた。
「収量変動の研究0」
収量変動の三番目の研究は一九二四年にP/iilosopMcal Transactions ofl/ie力oeal socie.^of London誌に掲載された。それは次の文章で始まつている。
現在、天候の穀物に与える影響に関する事実にいささかの異論もない。一大国策産業にと つて計り知れないほど重要であるにもかかわらず、この問題が難解であるのは、固有の複雑 さのせいかもしれないし、……実験あるいは生産条件下で得られる量的デー夕の不足のせい かもしれない……。
そして、五Hぺージにわたるすばらしい論文が続く。そのなかには経済学、.医学、化学、コン ピユータ科学、社会学、天文学、薬学で用いられる現代統計手法の基礎がある。それらのどんな 分野でも、相互に関連した数多くの原因の相対的影響を確立する必要があるのだ。その論文には きわめて独創的な計算手法(フィッシャーが手動式のミリオネアifE#機だけで什李をしたことを 思い出してほしい)や統計分析を行ぅためのデータ整理方法について賢い示唆を数多く含んでい る。スミス教授がこの論文を紹介してくれたことに、私は生涯感謝している。読むたびに、新し いことを学んでいるからだ。
『R ■ A .フイッシャ?者作集(coseaedpapers o/i?, A .fYS/ler)』全五巻の第一巻は、一九... 四年に発表した論文で締めくくられている。当時三四歳であったフイッシャーの写真が巻末にあ る。腕組みをして、髭もよく手入れされている。眼鏡は以前の:与真のように厚くはない。彼は自 信に満ち、落ちついて見える。
それに先立つ五年前、フイッシャーはロザムステッドで目を見張るべき統計部門を築いていた のだ。彼の指導のもとで統計分析の理論と実際に対して大きな貢献をもたらしつづけるようなフ ランク.イヱーツのごとき共同研究者を雇った。いくつかの例外はあったが、力ール*ピアソン の学生は消え去ってしまった。ピアソンの学生たちが生物測定研究所で研究していたあいだ、彼 らはピアソンの助けにはなったものの、ピアソンの拡張以上のことはできなかった。ほとんど例 外なく、フイッシャーの学生は彼の励ましに応え、自ら光り輝く独自の道を切り開いてきたのだ。
一九四七年にフイッシャIはBBCラジオの講演に招かれ、科学の本i^.Rと科学的発見について 次のように語っている。
科学が歩んできた道のりはある意味では妙なものである。その存在意義は自然認識の増大 にある。ときとしてそれゆえに自然認識の増大が起こる。しかし、この自然認識の増大は、 適切でない場合もあれば、気分を害される場合もある。過去に詳細に説明された見方が時代 遅れになったり、誤っているように見えるのは、ある程度避けられないものだ。私が思うに、 多くの人々はこうしたことをわかっているし、もし 一o年かそれ以上ものあいだ教えてきたことにいくばくかの修正が必要となった場合には、それを善意に解釈するだろう。.しかし何 人かは、自尊心を傷つけられたとか、自分たちの独占している領域を侵されたとか、間違い なく深刻に受け止めるだろう。そして春の日にちっぽけな縄張りに割り込まれたと憤慨して いるコマドリやズアオアトリのょうに反応するに違いない。私はそういつたことになんらか の対処ができるとは思わない。それは私たちの専門分野に特有の性である。だが、人類を豊 かにする宝石を持っている若い科学者なら、君をさんざん罵倒したがっているやつがいるの は間違いないょと、注意かつアドバィスされるかもしれない。
「百年に:::度の洪水」以上に予測できないものはない。荒れ狂ったように河川から水が溢れ出す ような洪水は稀で、百年に一回程度しか起こらない。そのような災害に誰が備えるだろうか。め ったに起こらない洪水の水位をどうやって推定できよう。現代科学では、統計モデルが多くの観 測値の分布を扱うのだとしても、これまで起きたことのない、ないしは起きたとしてもかつて一 度だけの洪水のために統計モデルに何ができるだろうか。ところがL - H - C .テイペットはあ る解を発見したのだ。
レオナード-ヘンリー■キヤレブ.テイペット(Leonard Henry Caleb Tippet)は一九0ニ年 にロンドンで生まれ、インペリアル■カレッジで物理学を学び、一九二三年に卒業した。テイべ ットによれば、「正確な測定へのこだわり……当時の科学論争に対する一つの秩序立ったアプロ 一チ」があったがゆえに物理学に惹きつけられた。
彼は若いころの熱意を思い出してこう続けている。「われわれは仮説を真偽のどちらかしかな いと考えがちだったし、実験こそが知識を成長させる主要な道具と見なしていた」。
テイペットは実験をする機会を得たときに、実験結果が理論上の予測と完全に一致しないこと に気がついた。自らの経験から、「理論を捨てるより、サンプリング手法を改善する(ここでは 統計分析を指している)ほうがよいことがわかった」と述べている。自分の愛した理論が個々の 観測値についてではなく、母数についてのみ情報をもたらすことを悟ったのである。
このようにして、(公刊した論文で知られるようになった)L.H.C ■テイペットは実験を 通じてわかってきたように、統計革<^叩に歩調を合わせたのである。卒業後、彼はイギリス綿エ業 研究協会の統計専門員の職を得た。そこは通常シャーリー研究所と呼ばれ、近代科学手法を爪い た綿布製造の改良を試みていた。最も厄介な問題の一つは、紡いだばかりの新しい綿糸の強度に ついてだった。繊維を撚り合わせた!本の綿糸が切れるまでの張力は、同じ条件で撚られていて も、そのつど大きく異なっていた。テイペットは慎重に実験を重ね、異なる張力を加えた綿糸の 破断面を顕微鏡で調べた。そして、糸の破断は撚った糸のなかで最も弱い繊維の強度に依存する ことを突き止めた。
最弱の繊維?どうすれば最も弱い繊維の強度をモデル化できるのだろうか。この問題を解決 できなかつたので、テイペットはユニハーシテイ■カレッジ* ロンドンにあるコールトン生物測 定研究所の力ール■ピアソンのもとで研究することを願い出て、一年間の研究休暇を与えられた。
そこでの経験について彼は次のように書いている。
当時のユニバーシテイ■カレツジはわくわくするところだった。力ール.ピアソンは偉大 な人物で、われわれも彼の偉大さを実感していた。彼は仕事中毒で、熱心に研究室のスタッ フや学生たちを鼓舞していた。私がそこにいたころ、彼はまだ研究を続けており、興奮と熱 意に溢れた最新の研究成果を講義してくれた。肖時、彼の研究路線はやや時代遅れだったも のの、講義が刺激を欠くことはなかった。……ビアソンの講義の一つ「一七、一八世紀の統 剖学史」は彼の関心の幅広さを最もよく表している。……彼は論争好き.で……彼が出した一 連の出版物は「今日の質問、けんかの質問」と名づけられていたほどである。……活発な議 論を闘わせてきた影響はあちこちに見られた。学科の部屋の壁はモッ^と風刺漫画で飾ら れ……そこには……「スパイ」によって描かれた「口先のうまいサム」の風刺画があった。 サムとは一サミユエル-Jウイバーフォ一ス、'1;教(Bishop wilberforse)のことで、i八六 〇年のイギリス学術会議でダーウイニズムについてT.H.ハクスリー(T.H.HUXiey)と決 闘に近い論争をしたことで有名である。過去lo年間にわたる出版物が展示されており、学 科の関心は「人類が受け継いできた宝(ヒトの物理的■精神的■病理学的特長の系図)」や 「ダーウイニ'スム医学の進歩優生学」というタイトル力らもi^てとれた。力ール.ヒア ソンがゴールトンと密接な関係にあったことをわれわれが思い起こすのは、年一回の学科主 催の夕食会のことで、一年間の研究成果を説明するやり方が、ゴールトンが存命中に提出した報告書と同じスタイルだったのである。そして「生物測定の死者たちへ」と言って乾杯し たのだ。
これは力ール.ピアソンの最後の活躍期にあたり、まだフイッシヤーやピアソンの息子の研究 が、科学者としてのピアソンの成果の大部分を過去の遺物のごとくゴミ箱に追いやってしまう前 のことだつた"
ピアソンの研究室のあらゆる興奮を持ってしても、またテイペットがその滞在中に自ら研鑽し たあらゆる数学知識を持ってしても、最も弱い繊維の強度の分布を求める問題は未解決のままだ った。シャーリー研究所に戻ってから、テイペットは複数の重要な数学上の発見の背後には一つ の単純な論理的真理があることに気がついた。極値分布と標本データの分布を結びつけるに違い ない、一見単純な、ある式を発見したのである。
数式が書けることと、それが解けるということは別問題である。テイペットはピアソンに相談 したが、彼の助けにはならなかった。七五年にもわたって専門エンジニアは山ほどの数式とその 解法を開発してきており、それらは浩瀚な便覧のなかにa出すことができる。だが、これらの便 覧のどこにもテイペットの数式はない。
テイペットは代数の不得意な高校生と同じようなことをするしかなかった。答えの見当をつけ て??結果として式が解けたのである'」これがその式の唯一の解なのか?自分の問いに対する 「正しい」答えなのか?フイッシヤーに相談したところ、フイッシャーはテイペットが推測したものと同じものを導いたほかにも二つの解があり、解は全部で三つしかないことを示した。こ れらは「極値分布についてのテイペットの三つの漸近分布」として知られている。
極値分布
極値の分布がわかったところでいったい何の役に立つのだろうか。もし極値の分布と通常値の 分布の関係がわかっているならば、毎年の最高水位を記録しつづけ、百年に一度の洪水を起こし かねない水位を予測できる。このようにできるのは、年ごとの最高水位の記録があればテイべッ トの分布の母数を推定するのに十分な情報となるからだ。ゆ£に、アメリカ陸軍エ兵隊は河川の 堤防の高さをどのくらいにするかを計算できるし、アメリカ環境保護庁は工場から排出されるガ スの最大景を規制する排出基準を設定できる。おかげで綿産業は、最も弱い繊維の強度の分布の 母数に影響を与える?糸製造のこれらの要因を突き上:めることができるようになった。
一九五八年、当時コロンビア大学工学部教授だったエミール.J .グンべル(Emil J.Gibel) は、この分野のテキストの決定版『極値統計学(cofa5r.as-s o/tgsfremes)』を出版した。それ以 来、ちよっとした追記や状況に応じた概念の拡張が加えられているが、グンべルのテキストはこ の分野を扱うにあたって統計学者が知っておかねばならない点をすべて網羅している。このテキ ストはテイペット独自の研究だけでなく、のちに精緻化された理論をも含んでおり、その大半は グンべルの手によるものだった。
政治的殺人
グンべルは興味深い経歴の持ち主である。一九二〇年代末から三?年代初めにかけて、彼はド ィツの大学の新米教員だった。彼の初期の論文は、高い潜在能力を秘めた人物であることを示し ていたが、評価はよくなかった。そのような状況にあっては、彼の職は保障された身分からはほ ど遠く、妻子を養ぇるかどうかは政府当局の気分次第であった。
当時ドィツでは、ナチスがやりたい放題であった。ナチスは公には政党の一つだったが、国家 社会主義党は本当のところギャング政党にほかならなかった。ナチス突撃隊は、脅迫、暴行、殺 人などの手段に訴ぇて、党の意思を強制するごろつきどもの組織だった。ナチス党に批判的な者 は誰でも暴行の対象となり、しばしば見せしめに公衆の面前で暴力が振るわれた。
グンべルにはそのような公衆の面前で暴行を受け、殺された一人の友人がいた。その殺人事件 には多くの目撃者がいて犯人を特定できそうだった。しかし、裁判所は証提不十分として^件 に関与したナチス突撃隊員を無罪にした。
グンべルはぞっとした'」公判に出廷した彼が見たものは、判事がすべての証拠を退けて勝手な 判決を言い渡し、ナチス党員が歓声を上げているさまだった。グンべルはほかにも公然と殺人が 行われた事例を調べたが、誰一人として有罪になっていなかった。司法省がすでにナチスによっ て転覆され、多くの判事がナチスのシンパかナチスの手先となっているという結論に達した。
グンべルは数多くの殺人事件を集め、目撃者にインタビューをし、殺人者たちの不当無罪を文 書にしていった。一九二:::年に彼は自らの調査結果を『四年間の政治的殺人(werjae-e poaisc/z^rMord)』という本にまとめて出版した。多くの書店がナチスを恐れて本を店頭に置 こうとしなかったので、販売の手配を自らしなければならなかった。その間も事件を収集しつづ け、一九二八年に『政治的殺人の原因』ド〕を出版した。グンべルはナチスに対抗する 政治勢力をつくろうとしたが、学者仲間の多くは仰天した"ユダャ人の友人たちでさえ同調する のを怖がった。
ナチスが一九三三年に政権を奪ったとき、グンべルはスイスで開かれていた数学会の大会に出 席していた。彼は新政権に反対するため、すぐさまドイツに戻りたがったが、国境を越えたとし ても逮捕されて殺されると友人たちに説得され、辛うじて思いとどまった。ナチスが政権をとっ た初めのころ、すべての国境が統制される前に、ドイツの指導的な確率論学者リチャード.フォ ン■ミーゼス(Richard von Mises)のょうに、何が起きるかを予知した少数のユダ^^^教授は亡 命した。グンべルの友人たちもこの機に乗じ、グンべルの家族をドイツ国外へ脱出させた"グン ベル一家はフランスに住んだが、一九四?年にはそこにもナチスが侵攻してきた。
グンべルー家は南フランスの非占領地域に逃れたが、そこはナチスの要求に屈した傀儡政府の 支配下にぁった。ナチスは国家に敵対する人物の名を挙げてフランス政府に引渡しを要求し、多 くのドイツ人民主化運動家の生命に危険が迫った。グンべルもそのうちの一人でぁった。ほかに マルセイユにとどまっていたドイツ人難民のなかには、作家トーマス-マンの兄ハインリヒ*マン(HeinrichMann)やリオン-フォイヒトヴァンガー(LionFeuchtwanger)がいた。
マルセイユのアメリカ領事だったハイラム-ビンガム四世は、アメリカ国務省の規則を破って ドイツ人難民に査証(ビザ)を発行し始めた。この行為のために彼はワシントンから叱責され、 領事職を解任された。だが、もしナチスの思いどおりになっていたなら死んでいたはずの多くの 人々をビンガムは救うことができたのである。グンべルー家はアメリカにたどり着き、そこでグ ンべルはコロンビア大学の職を得たのだった"
数学書にはさまざまなタイプがある。「決定版」とされるテキストのなかには定理と証明が示 されただけで、動機づけがほとんど、もしくはまったくなされていないょうな、おもしろみに欠 けたものもある"なかには、証明が誇張されすぎて難解で、仮説から結論へたどり着くまでには 相肖の覚悟を決めてかからねばならないものもあれば、エレガントな証明でいっぱいで、数学の 道筋は見るからに簡単なステップで最終結論に苦もなく到達できるほど要所を捉えたものもある" きわめて少数ではあるが、問題の背後にある考え方や背景を説明しょうとしたり、問題となって いるものの歴史を記述したり、興味深い実生活から例をとったものもある。
この最後に挙げたものが、グンべルの著書『極値統計学』の特徴を表している。それは難解な 問題をとてもわかりやすく表現しており、この問題の開発に関する参考文献で溢れている。第一 章はr目的と手法」というタイトルでテーマを紹介し、この本の残りの部分を理解するのに必要 な数学を詳しく説明している。この章だけで、統計分布論で使う数学の優れた案内書になってい る。
また、この本は、大学一年生レベルの代数の知識があれば理解できるようになっている。私が この本を初めて読んだのは、数理統計学で博士号を取得したあとだったが、この第一章からかな りのことを学んだ"まえがきでグンべルは控えめにこう述べている"「意外に思われるかもしれ ないが、本書は科学の進歩への小さな貢献であっても、人類に貢献できるに違いないという願い を込めて書いた」
この本の貢献が「小さい」などとはとても言えない。ニ〇世紀の偉大な金字塔の一つとしてそ びえ立っている。エミール‘グンべルは人並みはずれた勇気と、最も難解なアィデアのいくつか を明快かつ簡潔な方法で伝える能力を併せもつ稀有な人間の一人である。
ィギリスの王立統計学会は、毎年三つの学術雑誌を刊行し、年次大会を開催している。その大 会の招待講演者は自分の最近の研究について報告することになっている。王立統計学会の雑誌の 一つにでも論文を掲載するのは難しいことである。論文はその内容が正しいかどぅか、少なくと もニ人の杳読者(レフヱリー)にょって調べられ、また編集長と副編集長が両者とも知識の顕著 な増大に相当すると合意したぅえでなくてはならない。年次大会の講演に招待されるには、さら に高いハjドルを越えなくてはならない。これは、その分野で最も卓越した研究を行った者だけ に与えられる栄誉なのだ。
招待講演に続いて聴衆の学会員にょる討論が行われるのがこの学会の慣例である。討論者に選 ばれた学会員には前もって講演原稿のnピーが渡されているので、討論はしばしば詳細かつ痛烈
第ズ章フィツシヤーの曝利
なものとなる。しかるのちに、王立統計学会誌は、論文と討論者のコメントを掲載している。
学会誌の記述からも見てとれるが、その討論はとても形式ばっており' いかにもイギリス調で ある。まず、議長(または指名討論者)が自身のコメントに続いて、感謝の決議に;票を投じる ために起立する。次いで年長の指名討論者が自身のコメントに続き、感Itの決議にニ票目を投じ るために起立する。その後、最も高名な学会員の数名が一人ずつコメントをするために起立する のだ。しばしばアメリカやオーストラリア、また他の国々から招待される非会員のコメントも含 まれる。?演者はこれらのコメントに応える。なお、討論者と講演者の双方が、学会誌掲載の前 に、自らの発言を編集できる。
ー九三四年ーニ月ー八日、王立協会会員であり理学博士でもある尺.八.フイッシャー教授に、 そのょぅな論文を報告する類まれなる栄誉が与えられた。事実上、孤立していた一九二?年代を 経て、フイッシャIはついに己の才を認められたのである。前章で見たょぅに、われわれの知る ところでは、フイッシャーの最終学位は理学修士であったし、彼の「大学」はロンドンから離れ た農業試験場だった。一九三四年までに彼は、新たに理学博士号を取得し、栄誉ある王立協会会 貝(Fellow of the prestigious Royal802.£^この頭文字をとって!^尺3と称する)に選出された。 そしてついに王立統計学会は、彼をその分野の先導者の一人として地位を認めたのである。
この栄誉にあたって、フイッシャーは論文「帰納的推測の論理(The Logic of Inductive Infer- ence)Jを報告した。王立統tf学会長の王立協会会MM'グリーンゥッド(M.G^eenwood)教授 がその大会の議長だった。学会誌に掲載されたその論文はー六ぺージにわたり、フイッシャーの直近の研究を注意深く構成した明快な要約となっている。最初の討論者はA ■ L ?ボゥリー (A.rBowley)教授で、彼は感謝の決議を提案し、次のようにコメントしている。
ご報告いただいた論文に対してというよりは、統計学一般にわたる貢献に対し、フイッシ ャー教授に感1-するこのような機会を与えていただき光栄です。教授が統計学研究に注いだ 莫大な熱意、数学的ッールの威力、イギリス、アメリヵやその他の地域への影響力の大きさ さらには数学の正しい応用であると確信した統剖学に対して与えつつけた刺激に、私やここ に同席しているすべての統計学者が感謝するのによい機会であります。
ヵール■ピアソンは討論者のなかには入っていない。これに先立つ三年前の一九三一年に、ピ アソンはロンドン大学の職を辞していた。彼の指導のもと、ゴールトン生物測定研究所は大学の れっきとした生物測定学科へと成長した。
ピアソンの退職後、この学科は:::つに分割された。新しくできた優生学科の学科長にはロナル ド.エイルマー■フイッシャーが指名を受け、力ール' ヒアソンの息子であるエコン.ピアソン が縮小された生物測定学科の学科長に指名され、ゴールトン生物測定研究所を受け継ぎバイオメ トリ力誌の編集長となった。
フイッシャーとピアソン.ジュニアとの関係はよくなかった。これは完全にフイッシャーに落 ち度があった"彼はエゴン.ピアソンに敵意むき出しで接していた。穏和なエゴン■ピアソンは.フイッシャーが自分の父親を嫌つていることや、それ以上にイェジー.ネイマン(ネイマンとエ ゴン.ピアソンの共同研究については第10章で述べる)を嫌っていることに苦しんでいた。しか し、ピアソン■ジュニアはフイッシャーの研究に最大限の敬意を払っていた。後年彼は、フイッ シャーが刊行物のなかで彼の名前を決して取り上げなかったことにもすっかり慣れたと語ってい る。こういった緊張関係や二つの学科間の縄張り争いがあったにもかかわらず、フイッシャーと エゴン.ピアソンは学生たちを互いの講義にB席させたし、公然と論争を交えることはしなかっ た。
当時、学生たちから「親父」と呼ばれていた力ール■ピアソンは、一人の大学院生を助手とし て与えられ、,:3分のオフイスを持つことを許されていたが、彼のオフイスは二つの学科や生物測 定研究所のある建物から離れたところにあつた。フイッシャーやエゴン.ピアソンとともに一年 間研究するためにアメリカから来たチャーチル.アイゼンハー.rは力ール.ピアソンに会いたが ったが、仲間の学生や教授たちは勧めなかった。彼らは尋ねた。なぜ、誰もが力Iル■ピアソン. に会いたがるのたろう。フイッシャーの豊富な知性から溢れ出てきたわくわくするょうな新しい アイデアや手法に対して、ピアソンは提供すべきものを持っていただろうか、と。だが、アイゼ ンハ1-^はロンドンにいるあいだに力ール-ピアソンに一度も会いにいかなかつたことを悔やん でいた。ピアソンはその年のうちに亡くなつたからである。
統計学に対する見解の違い??フイッシャー派対ピアソン派
ある哲学の違いが力ール.ピアソンとフイッシャーの分布へのアプローチを分かつこととなっ た。力jル,ピアソンは統ポ的分^を、分析する実際の収集データを表現しているものと考えた。 かたやフイッシャーによれば、真の分布は抽象的な数式で表現され、収集デ?タは真の分布の母 数を推定するためにだけ使うことができるものだった。そのような推定量はすべて誤差を含んで いるので、フイッシャーはそうした誤差の程度を最小にするか、あるいは他のどんな手法よりも より真の値に近い答えをもたらすような分析手^を提案したのである。
一九二o年代には、フイッシャーがこの論争に勝利したかのように見えた。だが一九七〇年代 になると、ピアソン流の見方が復活した。もし生きていたとしても、ピアソンは、彼の考えを受 け継いだ者たちの議論をほとんど理解できないと思われるが、本書の執筆時点において、統計学 界はこの問題をめぐって二分されている。フイッシャーの明快な数学的考え方は、ピアソン流の 見方の#後にある性質をピアソン自身が直視することを妨げていた混乱の残骸を跡形もなく片づ けてしまった。またピアソン流アプローチの復活で、フイッシャーの理論的研究と向かい合わざ るを得なくなっている。私は本書のなかで折に触れ、これらの哲学的問題を見ていこうと考えて いる。というのも、現実に統計モデルを応用するにあたって深刻な問題が存在するからである。 まずはここで見ていくことにしたい。
ピアソンは観測値の分布を一つの実在物として見た。彼のアプローチによれば、所与の状況で は膨大であるが有限個の観?値の集合が存在する。理想的には、科学者はこの観測値すべてを収 集でき、.その分布の母数を決定できるのが望ましい。もし、すべてを収集できなくてもとても 大きい代表的な部分集合が収集できたと考えるのだ。
大きい代表的な部分集合から計算された母数は、完全な観測値の集合から計算された母数にほ ぼ等しい。さらに、完全な観測値集合から母数を計算するのに用いた数学的方法を、部分集合か ら母数を計算するのに使つたとしても、深刻な誤差をもたらすことはないのである。
一方、フイッシャーにとって観測値は、ありうる観測値の全集合からランダムに選ばれたもの だった。その結果、ランダム抽出に基づいた母数のどんな推定値もそれ自体がランダムであり、 確率分布を有することになる。元来の母数の考え方とこの考えを区別するために、フイッシャj はこの推定値を「統計量」と呼んだ。これは現代の専門用語ではしばしば「推定量」と呼ばれて いる。
ある母数を推定するための統計量を導出する手法がニつあるとしよう。たとえば、生徒の習熟 度(母数)を測りたい教師が一群のテ.ストを行い(観?値)、その平均(統計R:)を求めたとす る。そのときの統計量として、メデイアン(中央値)をとるのが.「よい」のかテスト群のうち の最高点と最低点の平均をとるのが「よい」のか。それとも最高点と最低点を除いたテストの点 数に対して平均をとるのが「よい」のか。
統計量はランダムなので、ある一つの値がどれほど正確かを語るのはナンセンスだ。同じ理由で一つの観測値について議論したり、精度をとやかくいうことも意味がない"必要なのは統計量 の確率分布が依存する基準であり、まさにこれはピアソンが観測標本を個々の観測値ではなく、 確率分布に基づいて評価されるべきだと主張したのと同じことである。フイッシャーは望ましい 統計量についての基準をいくつか提案した。
一致性:デー夕が多.ければ多.いほど、計算して求めた統計量の値が母数の真の値に近づく確率 が高くなる。
不一P性;異なるテータセットごとにある特定の統計量を計#すると、その計算して求めた値の 平均は母数の真の値に近づくはずである。
効率性:統計量の値が母数の真の値とまったく同じでなくても、母数を推定する統計量を求め ると、その値の大部分は真の値からそれほど離れてはいないはずである。
これらの説明は多少あいまいである。というのも、数学的に定式化されたものを平易な言葉に 言い換えているからだ。実際のところ、フイッシャーの基準は数学を適切に使って評価すること ができる。
フイッシャー後の統計学者たちは他の基準を提案してきている。フイッシャー自身、のちの研 究でいくつかの副次的な基準を提案している。これらのすべての基準の紛らわしさを除いてしま うと、重要なことは統計量それ自体をランダムなものとして考えていることであり、よい統計量はよい確率上の性質を有していることである"あるデjタセットから得た統計量の値が正しいか どうかは決してわからない。唯一いえることは、これらの基準を満たすような統計景を導く手法 を用いてVるということである。
フイッシャーが提案した基本となるー:ー基準のうち、「不偏性(unbiasedness)」というR準は一 般の人々にも想像しやすいものである。これは「偏り(bias)」という言葉自体が受け入れがた いニュアンスを帯びているからに違いない。偏りのある統計量など誰も必要としていないように 思える。アメリヵの食品医薬品局の公式ガイドラインによれば、(統計)手法は「偏りを避ける」 ように使用すぺきと勤告している。「1丁1(分析)」と呼ばれるとても奇妙な手法は(第27 章で詳細に議論する)、多くの臨床試験で主流となりつつある"なぜなら、この手法は、効率性 M準を無視しているが、結果の不偏性は保証されているからだ。
実際には、偏りのある統計量は有効性が高いので、よく用いられる"フイッシャーのいくつか の研究によれば、公営上水道を浄化するために必要な塩素濃度を決定する標準的方法は、偏りの ある(しかし一致性、効串性を満たす)統計量に依存する。これはすべて、ある概念を明確に定 義するためにつくられた言葉が、どのようにその情緒的イメージを科学上のものと一致させてい くのか、また人々の行動にどう影響するのか、という科学の社会学的側面におけるある種の教訓 となつている。
フィッシャーの最尤法
フイッシャーが数学的に解き明かしたところ、分布の母数を計算するのに用いたピアソンの手 法は、必ずしも一致性を満たさないぅえ、しばしば偏った統計量をもたらすこと、さらにはもつ と効率的な統計量が利用できることに気づいた。一致性があり、効率的な(ただ必ずしも不偏で ある必要はない)統計量を導くために、フイッシャーは「最尤推定量(MLE)」を提案した。
そしてフイッシャーは(もし「正則条件」として知られる数個の仮定が満たされるのであれ ば)MLEが常に一致性を持ち、すべての統計量のなかで最も効率的であることを証明した"さ らに、もしMLEに偏りがあれば、その偏りを計算してMLEから差し引くことで、一致性、効 率性、不偏性を持つ修正推定量が得られることも証明した。
フィッシャーの尤度関数は数理統計学のコミュニティーに広がり、すぐに主要な母数推定法と なった。ただ、最尤推定には一つだけ問題があった。MLEを計算する際に求められる数学的条 件が手ごわかったのである。フイッシャーの論文を見ると、異なる分布に対するMLEを導出す るための複雑な代数で埋まっている。彼の分散分析と共分散分析のためのアルゴリズムは数学的 業績だが、そこで彼はMLEを必要とするユーザーに公式を提供するため、多次元空間における 巧妙な代入や変換を駆使したのだった。
フイッシャーが工夫をこらしたにもかかわらず、多くの場合、MLEの潜在ユーザ?の手に負えない数学になっていた。ニ〇世紀後半になると統計学の文献には、特定のケースにおいてML Eのよい近似が求められるよぅな、簡単な数学を使ったとても優れた論文が多く見受けられる。 私の博士論文(一九六六年ごろ)では、不本意ながら大量のデー夕があるときに限って有効な解 に甘んじなければならなかった。大量のデータがあると仮定することで、尤度関数をある程度簡 単なかたちにでき、MLEの近似値を計算できたのである。
そこへコンピユータが登場した。コンビユータは人間の頭脳で太刀打ちできる相手ではない。 コンビユータはまさに辛抱強く、姓理能力の高い巨大な機械である。退屈したり、眠ったり、ミ スをしたりすることもない。厄介な計算を、何回も何回も何回も、数百万回も「くり返して」計 算する。MLEは「くり返しアルゴリズム」として知られる方法で求められるのだ。
くり返しアルゴリズム
くり返しを用いた初期の数学手法の一つは、ルネサンス期に出現したよぅである(もっとも、 デイヴイッド-スミス(Davidsmith)は|九ニ三年に出版した著書『安^.0?7/0/?0^6_0^5』 で、この手法の例が初期エジプトや中国の文献に残っているとして異論を唱えているが)。
資本主義の黎明期に、北イタリアで組織された銀行や会計事務所は初歩的な問題に直面してい た。各々の小さな都市国家や固は自身の通貨を持っていた。会計事務所は、たとえば、一二七ヴ Hネチア■ダカット〔lerネjで買った山ほどの材木が、もし交換レートがーダカット当たり一四アテナィ■ドラクマ^〕であるときに、ドラクマでどのくらいの価値に当たるか換 算する方法を見つけださなくてはならなかったのである。ム-7日では、代数方程式を使って答えを 出すことができる。高校で習つた代数を思い出してみてほしい。もし、Xをドラクマの価値とす ると 。
当時、数学者たちは代数を発展させつつあったが、この簡単な計算方法は多くの人々に利用で きるものではなかった。銀行家は、「挾み撃ち法-Ee of false psition)」と呼ばれる手法を用い た。各会計事務所はこの方法の独自版を持っており、それは秘密のべールに包まれて、番頭に伝 えられた。といぅのも、各会計事務所は自分たちのやり方が「最良」だと信じていたからである。
Hハ世紀のィギリスの数学者ロバート.リコード(RobertRecorde)は、新しい代数の記法を 普及させたことで知られている。代数方程式と挟み撃ち法を対比させるために、リコードは一五 四ニ年に著した『7%¢ {?row?&0/^4r^-に、挟み撃ち法の版を?介している。
ロバート*リコードがHハ世紀の英語で0一Eわんとしているのは、最初に答えを推測し、それを 問題(となる式)に^てはめなさい、ということだ。推測した答えを用いた結果と、あなたが望 む結果とのあいだには乖離が生じるだろう"その乖離をよい推測をするために利用するのである。 次にその新しい推測を問題に当てはめて、新たな乖離を求め、さらに次の推測をする。もし乖離 幅を計算する方法に長けていれば、(次々と行う)推測は最終的に正しい答えに到達するだろう。 「挾み撃ち法」では、くり返しは一回だけですむ。二回目の推測は常に正しいのである。フィッ シャーの最尤法では、よい答えを得るまでに数千回、場合によっては数百万回のくり返しが必要 となるかもしれない。
忍耐強いコンピユータにとって、ほんの百万回のくり返しはどんなものだろうか。今?の世界 では、せいぜい瞬きしている程度のことだ。コンピユータの性能が悪く、処理能力も遅かったの は、それほど前のことではない。一九六〇年代後半、私はプログラム可能な計算機を持っていた。
それは加減乗除ができる原始的な電子機器だった。だが、それには小さなメモリー(記憶装置)
があり、四則演算を次々に行うプログラムを入力することができた。プログラムの行を変更する 操作もできた。このプログラム計算機を使って、くり返し計算をすることができたのである。
計算には長い時間がかかった。ある日の午後、私はプログラムを入力し、最初の数ステップを チェックしてプログラムに間違いがないことを確かめた。そして、研究室の電気を消し、家路に ついた"その後もプログラム計算機は静かに加減?除を行い、電子回路のなかでモグモグ言って いた。くり返し計算がー?終わるごとに、結果をプリントアゥトするようにプログラムしていた" 計算機のプリンターは「ガーガー」火きな音を立てる、うるさいィンパクトタィプだった。
その夜、清掃員たちがビルの掃除にやって来て、そのなかの一人がほうきとちり取りを持って 私の研究室に入った。暗闇のなかで、ブーンといううなり声が聞こえた。そして彼は、計算機の |つEEの青い光が演算を行うごとに何度も点減するのを見たのである。突然、機械が目を覚まし、
「ガガー」と言ったかと思うと、「ガガー、ググー、ガガガー、グガガガガガ. .」と1尸を上げた。
のちに清掃貝は恐ろしい経験だったと私に言い、次からはコンビユータが動作中であることがわ かるように何らかの掲示を出してほしいと頼んできた。
今日のコンピユータはもっと動作が速く、より複雑な尤度も分析できるようになった。ハーバ hド大学のナン■レアード(NanLaird)教授とジヱームズ■ゥェア(James ware)教授は、「E Mアルゴリズム」として知られる柔軟で強力なくり返し計算法を発明した"私が編集していた統 計学術誌ては最|/号か出るたびにヵつて解くことができなレと考えられてレた問題に£\アルゴリズムを適用する方法が述べられていた。他のアルゴリズムは「シミュレーテッド.アニー リンク」と力「クリギング」というような洒落た名前をつけてアヒールしていた。ほかにも、 発見者にちなんで名づけられたメトロポリス■アルゴリズムやマーカット■アルゴリズムなどが ある。このようなくり返し計算を「ユーザー■フレンドリー」に行える、数百数千のコ^ ?ドを 持つ複雑なソフトゥェア.パッケージも登場している。
統計的推測に対するフイッシャーのアプローチは勝利を収めた"最尤法は世界を制し、ピアソ ンの方法は歴史のなかでゴミのように扱われた。だが、折しもー九三〇年代に??ついにフイッ シャーが数理統計学理論への?献を認められ、四〇代という全盛期にあったころ??イェジ?- ネイマンという一人の若きポーランド人数学者が登場し、フイッシャーが絨毯の下に追いやった 問題のいくつかを問い始めていた"
計量生物学会は毎年三月にアメリカ南部の都市で春の大会を開催する。北部に住んで仕事をし ている人間は、ルイビルやメンフィスやアトランタやニユーオーリンズに下つて、早春の空気を 嗅ぎ、草木や果樹の花がいち早く咲くのを?る機会を得るのだ。他の学会の大会と同様に、一つ のセッションで三から五つの論文を報告し、討論者や参加者はそれらの論文について、導出に関 する疑問や他のアプローチ方法がないかといつた質問をする。通常、午前中に二つのセッション が並行してあり、短い昼休みを挟んだあと、午後にも同じくまたニセッションがある。たいてい 最後のセッションは五時ごろに終わる。参加者はホテルの部屋へ戻るが、一時間から一時間半後 に仲間内で集まり、地元のレストランへと夕食に出かける。
たいがいはセッションで顔を合わせた友人たちと、その日の夕.食の約束をする".ある日、私は
第^章死に至る分量
夕食の約束をしそびれた。午後の報告者の一人と長々と興味をそそられる議論をしていたのだが、 彼は近くから来ていて家に帰るというので、夕食の約束をしなかったのだ。議論が終わったとき には会場は空っぽで、連絡をとる人ひとりいなかった。私はホテルの部屋へ戻り、妻に電話をか け、子供たちと話したあとで、ホテルのロビーに降りていった。知り合いのいるグルーフが見つ かり、一緒に食事に行くことができるだろうと期待して。
ロビーはがらんとしていて、布張りの椅子のI脚に座っている、長身で,日髪の男性ぐらいしか いなかった。私には彼がチェスター■ブリス(Chester Bliss)であることがわかった。彼が薬品 や毒物の反];&する分≫.を決めるのに使われる基本的な統?|モデルの開発者であることを知ってい た。そのHの午前中、彼が論文を報告したセッションに出席していたのだ。私は彼のところへ行 って自己紹介をし、彼の報告を褒めた"すると彼は席を勧めてくれ、われわれはそこでしばらく 統計学や数学について話し込んだ。そう、そのようなことを話したり、冗談を交わすことさえで きたのだ。:';人とも夕食の約束がないことがわかったので、|緒に食事をすることにした。彼は 自らの経験に基づく豊富な話題で、食事の席を盛り上げてくれた。のちのち学会の大会で一緒に なったときには食?をともにするようになったしゝィヱール大学続計学科主催の研究会に出席し たときには、そこで教鞭をとっていた彼をよく見力けた。
ブリスはアメリヵ中?部の堅実な屮流家庭の出身である。父親は医師、母親は専業主婦であり、 兄弟姉妹がいた。彼の関心は当初生物学にあって、大学では昆虫学を学んだ。一九二o年代末、 卒業と同時にアメリヵ農務嘗の昆虫学の研究職を得て、まもなく殺虫剤の開発に関わるようになった。殺虫剤の野外実験には制御不能な変数が数多く含まれており、結果の解釈が難しいことが すぐにわかった。彼は昆虫を屋内に持ち込み、実験室実験を準備した。誰かが彼にフイッシャー の『研究者のための統計的方法』を紹介した。この本をきっかけにして、フイツシャーがその本 で示した手法の背後にあるものを理解しようと努めた。そして気がついてみると、彼はフイツシ ャーのかなり数学的な色合いの濃い論文も読んでいたのである。
ブロビット分析
さっそくフイツシャjの本に従って、ブリスは昆虫の集団をガラス瓶のなかに入れ、組み合わ せと分量の異なる殺虫剤にさらすという実験室実験を計画した。これらの実験を行うにつれ、興 味深いことがわかってきた。どんなに殺虫剤の濃度を上げても、常に一、一;匹の昆虫は被晒した あとでも生き残っていたのだ。また殺虫剤をどんなに弱くしても、たとえ液体基剤のみを用いた としても、被晒後、数四の昆虫は死んだのである。
この明らかな変動をとらえるために、ピアソンの統計分布を使って殺虫剤の効果をモデル化す るのは有用だろう。だが、どうすればよいのだろうか。読者のなかには、フイツシャーの本の中 身を文章題のように考えてみたときに、高校の代数の授業でのいやな思い出を思い起こす人もい るかもしれない。AさんとBさんが流れの静かな川で、または安定した流れに逆らって舟を漕い でいるとか、おそらく油と水を?拌しているとか、前後にボールをバウンドさせるとか、そういった文#^があっただろう。それが何であろうと、文章題はなにがしかの数字を出して問いを立て る。そしてかわいそうな生徒はそういった文章を数式に置き換え、Xを解くのだ。また教科書の 前のぺージにさかのぼって、解答つきの似たような例題を探したり、例?の数式に別の数字を代 又しようと^たことを思い出す力もしれない。
高校の代数では、誰かがすでに数式を解いてしまっている。教師はそれらを知っているか、教 科書の教師用指導書のなかに見つけることができる。誰も数式に置き換える方法を知らない文章 題があると考えてみてほしい。その文章題のいくつかの情報は余分だったり、使うべきでなかっ たりする。決め手となる情報がしばしばなかったり、教科書には以前に解かれた類似例がなかっ たりもする。現実問題に統計モデルを適用しようとするのはこういうことなのである"ブリスが 殺虫剤実験に確率分布の新しい数学的アィデアを適用させようとしたときの状況は、まさにこれ だったのだ"
ブリスはある手法を発明し、「プロビット分析」と名づけた。彼の発明には、もともとの考え から相当飛躍する必要があった。どのように分析を進めていったらよいかというヒントは、フィ ッシャー、「ステユーデント」、そしてほかの誰かの研究のなかにさえもまったく見樂たらなかっ た。ブリスのモデルは(薬の)分量とその分量で昆虫が死ぬ「確率(probability)」を関係づけ るものだったので、「プロビット(probit)」という言葉を使ったのである。
彼の発明したモデルで最も重要な母数は「五〇%致死量」と呼ばれるもので、通常「LDI 50」と表記される。これは五0%の死亡率を有する殺虫剤の分量である。1-^121150の殺*弃を大量の昆mに散布すると、五〇%の昆虫が死ぬのだ。ブリスのモデルでは別の結論も導き出されて いる。それは特定の標本を殺す分量を決めることはできないというものである。
ブリスのプロビット分析は毒物学の問題にうまく応用されてきている。ある意味で、プロビッ 卜分析から得られた洞察が毒物学のかなりの科学的基礎をつくっている。プロビット分析は、一 六世紀の医師パラケルススによって最初に確立された学説「問題は分量であって、毒ではない」 に数学的基礎を与えることになつた。
パラケルススの学説のもとでは、分量が十分に多ければすべてのものが潜在的に毒となりうる し、分量が十分に少なければすべてのものが無毒となる"この学説に対してブリスは、個々の結 果に伴う不確実性を加えたのである。
多くの麻薬使用者が死んだり、コヵィン、ヘロィン、覚せい剤の麻薬中毒になってしまう理由 の一つは、彼らが死んではいないほかの麻薬使用者を目にしていることにある。彼らはブリスの 唐フようである。虫たちは周りを見て、仲間がまだ何匹か生き残つていることを知つている。し かし、まだ生きている個体がいることがわかったからといって、ある任意の個体が今後も生き残 る保証にはならない。一つの個体の反応を予測する方法はないのだ。ピアソンの統計モデルにお ける個々の観測値のようなもので、それらは科学が関心を持つ「こと」ではない。抽象的な確率 分布と(LDh50のような)その母数だけしか推定できないのである。
ブリスがプロビット分析を提案すると、それに続いて他の研究者たちが異なる数.学的分布を提 案した。LD?50を計算する現代のコンピユータ.プログラムには、ブリスの研究に改良を加えた異なるモテルが複数ありユーザーに提供されている。一?際のテータを用いてL D?50を推定 すると、どれも同じよぅな値を一不すが、し0110のよぅな低い確率の分≫を推定しよぅとすると 違いが見られるし
プロビット分析やそれに代わるモデルを用いて、ニ五%あるいは八0%で死亡する分量を表す LD?25、LD?80といった致死量を推定することもできる。五〇%からより離れた値を得よぅ とすればするほど、よい推定量を得るためにはより大規模な実験が必要になる。
かつて私はマウスに発がん性化合物のLDI01を決定する研究に関わったことがある。その研 究に六万五o〇〇匹のマウスを使ったが、結局のところ、われわれの分析では 一%のマウスにが んができる分量の最適な推定量はいまだに得られていない。この研究から得られたデータに基づ く計算で、LDI01の許容できる推定量を得るためには、数僮匹のマウスが必要だといぅことが わかった。
スターリン粛清期のソ連でのブリス
チヱスター.ブリスのプロビット分析に関する初期の研究は一九三三年に屮断された。フラン クリン?ル?ズべルトがアメリヵ合衆国大統領に選出されたのだ。大統領選挙のキャンぺーンで ルーズべルトは、不況の原因が連邦政府の財政赤字であることを明らかにし、財政赤字を削減し、 政府の規模を小さくすると公約した。それはニユーディール政策で最終的に行ったことではないが、選挙キャンぺーンの公約であった。
ルーズべルトが大統領に就任すると、政治指名した上級職員らはキャンぺーンの公約に沿って 不要な政府職員を解雇し始めた。新しい殺虫剤の開発を担当していた助手から農務次官補まで、 その部門が行ってきたことを調べて、昆虫がいる屋外ではなく研究室のなかで殺虫剤の実験をし ている愚かな奴がいることに気づいた。研究室は閉鎖され、ブリスは解雇された。気がついたら 彼は大恐慌の真っ只中で無職になったのである。ブリスがプロビット分析を発明したことは大し た問題ではなかったし、失業した昆虫学者、特に屋外で生息する昆虫を屋内で研究していた者が 職を失ぅことなどまったく問題ではなかった。
ブリスは、フイッシャーに連絡をとった。フイッシャーはロンドンで新しい地位に就いたとこ ろだった。ブリスに援助を申し出ていくばくかの実験設備を提供したが、彼のための職はなく、 アメリカ人昆虫学者を;展、っことはできなかった。だが、とにかくブリスはイギリスへ渡った。彼 は数力月間、フイッシャーとその家族とともに生活した。彼とフイッシャーはともにプnビット 分析の方法論を洗練させた。フイッシャーはブリスの数式にいくつかの誤りがあることを見つけ、 得られる統計量をょり効率的にする修正案を提案した。ブリスはフイッシャーの提案を生かして 新たな論文を発表し、フイッシャーはフランク■イH1ツとともに書いた統計表の新版に必要な 数表を組み入れた。
ブリスがイギリスで一年足らずを過ごしたあと、フイッシャーはブリスにある仕事を見つけて きた"それはソ連のレニングラード(現■サンクトペテルブルク)植物研究所の職だった"背が高く、痩せた、中西部出身の屮流階級のアメリヵ人、ノンポリのチェスター.ブリスは、それま で外国語を学んだこともなかったが、着るものだけを詰めた小さなスjッヶースを携えて列軍で ョーロッバを横断し、レニングラード駅に到着した。それはちょうど無慈悲なソ連の独裁者であ るスターリンが、地位の軽重を問わず官僚に対して血の粛清を始めたときであった。
ブリスが到着するとまもなく、彼を採用した人の上司がモスクワに呼び出された。そして二度 と彼の姿を見ることはなかった。一力月後、ブリスを採用した人がモスクワに呼び出され、その 帰途に「自殺」した。ブリスの隣の研究室にいた男性は、ある日、急にいなくなり、ラトビアと の国境を越えてロシアを脱出した。
その間にもブリスは研究に取り組み、ロシアの害虫のなかから選んだグループに異なる殺虫剤 の組み合わせを与え、プロビット分析でし0|50を算出した。彼は研究所の近くの家に間借りを した。大家のロシア婦人はロシア語しか話せず、一方ブリスは英語しか話せなかったが、ブリス が私に語ったところでは、身振り手振りと豪快な笑いを織り交ぜながら、とてもうまくやってい たそうだ。
あるとき、ブリスはアメリヵから来た若い女性に出会った。彼女はロシアにおける共産主義者 の偉大な実験に参加するために大学を辞め、若者の完全な理想主義と、真のマルクス卩レーニン 主義者への独断的盲信を抱いてやって来たのだ。英語しか話せないかわいそうなブリスの友だち になり、買い物や街屮を歩き回るのにつき合った。彼女は地元の共産党の党員でもあった。党は ブリスのことをすべて?んでいた。いつから雇われ、いつロシアにやって来たか、どこに住んでいるか、そして研究室で何をしているかも。
ある日、彼女はブリスに、党の数人が彼をアメリカのスパィであるとの見方を固めたことを話 した。彼女はブリスを弁護し、実験にしか関心のない、単純で愚直な科学者だと説明しようとし た。しかしながら、これらの疑念を通知されたモスクワは捜査のためにレニングラードへ委員会 を派遣した。
委員会はレニングラード植物研究所で召集され、尋問を受けるためにブリスが呼ばれた。部屋 に入つてゆくと、委員会のメンバーが誰なのか、ガールフレンドが教えてくれたとおりであるこ とがわかった。彼らがまだ最初のいくつかの質問をやっと終えたところで、ブリスはこう尋ねた。 「あなたがたの仲間にXX教授がおられることがわかりました(この話をしてくれたとき' その 教授の名を思い出せなかった)。そのかたの論文を読んだことがあります。提案された農業実験 の方法が、聖マルクスと聖レーニンの福音であるかどうかを教えてください」
通訳はこの質問を訳すべきかどうかとまどったが、それでも翻訳すると、委員会のメンバーか らちよっとしたどよめきが起きた。彼らはブリスに詳しく述べるように言った。
「XX教授の方法は正式な党の路線でしようか?」とブリスは尋ねた。「これは農業試験をする 際に党が要求している方法でしようか?」
最終的な返事は、そうだ、これが正しい方法である、というものだった。
「そうですか。そうおっしゃるのなら、私はあなたがたの信条に反しています」とブリスは言っ た。つづけて、この教授が提案した農業研究の方法は同じ処理をした広大な土地を必要としていることを説明した。このような実験では無駄が多いと指摘して、小さな隣接した区画を用意すれ ば、^画内に列をつくってそこに異なる処理を割り当てられることを自分は今まで推奨してきた と語った。
尋問はそれ以上行われなかった。その?、ガールフレンドは彼に委員会がブリスをスパィでは ないと判断したと話した。彼はあまりにあっけらかんとしていて、おそらく、彼女が彼を評した とおりの、実験に精を出す純真な科学者だったのだろう。
ブリスはそれから数力月間レニングラード植物研究所で研究を続けた。もはや上司はいなかっ た。彼は自分が最もよいと思ったことをしただけだった。だが彼は研究所職貝の共産党労働組合 に加入しなければならなかった。ロシアで職に就いている者すべてが政府の息のかかった労働組 合に所属するように強制されていたのである。一九五〇年代、アメリヵ国務省はかつて共産主義 組織に属したことがあるという理由で、ブリスにパスポートを発給しなかった"
ある午後、ガールフレンドが彼の研究室に飛び込んできてこう言った。rすぐにここを出なく てはなりません」。ブリスは実験がまだ終わっていないし、ノートにまとめていないと抵抗した。 しかし彼女はノh-rを取り上げると、彼にコートを着せ始めた。彼はただちに出発しなければな らなかったのだ。すべて諦めなさい、と彼女は言った。彼女は、彼が小さなスーッヶースに荷物 を入れ、大家にさよならを言うのを見届けてから鉄道の駅まで見送り、無事にリガ(ラトビアの 首都)に着いたら電話をするようにとしつこく言った。
一九六?年代初頭になり、ソ連での冷たい手の抑圧が少しだけ緩められた。ソ連の科学者は国際的科学者コミュニティーに復帰し、国際統計協会(ブリスはそのフヱローの一人であった)は レニングラードで会議を開催した。セッションの合い間にブリスは一九一:ー〇年代の旧友たちを訪 問する心づもりでいた。だが彼らは、スターリンの肅清期に殺害されていたり、第二次世界大戦 中に死んだりしていた。そのなかで大家の女性だけが健在だった。二人は肩を叩き、ぅなずきあ って互いに挨拶をし、彼が英語で幸多かれとつぶやくと、彼女はロシア語でそれに返事をしてい
さきの八章分を読んだ読者はおそらく、イギリスで単独に統計革命が起こったのだと信じるょ うになっただろう。統計モデルを生物学や農学に応用しょうとした最初の試みがイギリスやデン マークで行われたことを考えれば、この思い込みはある程度正しい。フイッシャーの影響を受け て、統計手法はまもなくアメリカ、インド、オーストラリア、カナダへと広がった。統計モデル が応爪に直結して英語圏で拡大していったのに対し、ヨーロッバ大陸には長い数学の伝統があり、 ヨーロッパの数学者は統計モデルに関連した理論的問題に取り組んでいた。
それらの理論的問題のなかで最重要だったのが、中心極限定理であった。一九三〇年代初めま でこれは未証明の定理であり、大多数が正しいと信じていたものの、誰一人として証明できない 推論だった。フイッシャIの尤度関数についての理論的研究は、この定理が正しいと仮定してい
第タ章ベル型曲線
た。ピエール■シモン.ラプラスは;九世紀初めにこの仮定を使って自らの最小ニ乗法を正当化 した。新しい科学である心理学は、中心極限定理を拠りどころに知能測定の手法と精神障害の尺 度を開発したのである。
中心極限定理とは何か
莫大な数値データの平均は統計分布を持っている"中心極限定理は、元のデータがどのょうに 得られたかにかかわらず、この平均の分布が正規確率分布で近似できるというものだ。正規確率 分布はラプラスの誤差関数と同じもので、「ガゥス分布」と呼ばれることもある。一般には「ベ ル型曲線」として大雑把に語られてきた。一.八世紀末にアブラハム.ド-モアヴル(Abraham deMoivre)は、運まかせのゲームから得られた簡単な数値データセットにおいて中心極限定理 が満たされることを証明した。続く一 五o年ものあいだ、この推論の証明には何の進歩もなかっ た。
この推論は、広く正しいものと思われてきた。なぜなら、ほとんどのデー夕を表現するのに正 規(確率)分^を用いることを正当化するからだ。ひとたび正規分布であると仮定すると数学 的にずっと扱いやすくなる。正規分布にはいくつかの大変優れた性質がある。もし、正規分布に 従うニつの確率変数があるなら、そのニつ確率変数の和も正規分布に従う。一般に、正規変量の 和や差すべてが正規分布に従う。したがって、正規変量から求められる多くの統計量はそれ自体
正規分布に従っている。
正規分布は力ール.ピアソンの四つの母数のうち、平均と標準偏差のニつの母数のみを持つ。 対称性(歪度)と尖度はゼロに等しい。これら二つの母数がわかっていれば、すべてがわかって いることになる。フィッシャーは、データセットから求めた平均と標準偏差の推定量が十分妥当 であることを示した。それらは、デー夕の持つすべての情報を含んでいるのだ。これらの二つの 数値は観測値から発見したすべてのものを含んでいるので、もともとの観測値を残しておく必要 はない。もし十分な観測値があって、平均と標準偏差のかなり精緻な推定ができるなら、もはや 観測値は必要なく、それ以上収集しようとしても、時間の無駄となる。たとえば、正規分布のニ つの母数を有効数字二桁までわかればよしとするなら、観測値を五〇個ほど集めればよい。
正規分布が数学的に扱いやすいということは、科学者が関係性の複雑なモデルを提示できると いうことだ。正規分布に従っている限り、フィッシャーの尤度関数はしばしば簡単な代数で扱う ことができる"くり返し解法が必要な非常に複雑なモデルにとっても、ナン■レアードとジエー ムズ.ゥHアのEMアルゴリズムは、正規分布であればとりわけ扱いが簡単になる。
モデル化の問題においても、統計学者はしばしば、あたかもすベてのデータが正規分布に従っ ているかのように見なす。というのも、数学的にとても扱いやすくなるからにほかならない。だ が、そのようにするためには屮心極限定理を使わざるを得なくなるのだ。
では、屮心極限定理は正しいのだろうか。より厳密には、どんな条件のもとで正しいのだろう
一九二〇年代から一:10年代にはスカンジナビア、ドイツ、フランスとソ連の数学者グループが、 ニ〇世紀初めに発見された一群の新しい数学手法を用いてこれらの問題を追及した。時はまさに、 すべての文明に差し迫った危機I魔の全体主義国家の隆盛Iに直面していた"
数学者は高価な実験設備を備えた研究室など必要としない。一九二〇年代や三?年代の数学者 の設備といえば、黒板とチョークであった。紙より黒板を使うほうが数学には適していた。とい うのも、チョークなら簡単に消せるし、数学研究では間違いはつきものだつたからである。
単独で研究する数学者はきわめて少なかった。もし、あなたが数学者なら、自分のしているこ とを議論する必要がある。自分の新しいアイデアを他者の批評の前にさらさなければならない。 間違いを犯したり、自分にはわからないが他者にとっては明白な、隠された仮定を含んでしまう ことはよくあることなのだ。
書簡を交換し、学会に行き、瓦いの論文を検討し、定期的に問題点を指?し、疑問を?し、派 生的な問題を探究するような数学者の国際的コミュニティーが存在する。一九三〇年代の初めに は' ドイツのウイリアム-フェラー(wmiamFeller)とリチヤード-フォン-ミーゼス、フラン スのポール■レヴイ(PaulL6vy)、ロシアのアンドレイ-コルモゴロフ(Andrei Kormocfaorov)、
スカンジナビアのイヤール-ワルデマール.リンデベルグ(Jarl Waldemar Lindeberg)やハラル
ド■クラメ ール、才1ストリアのアフラハム.ワルド>^3.11311:1^3.1&やハーマン*ハ ^レ
イ(HermanHa.rt.ley)、イタリアのグイド-カステルヌオーヴォ(Guido castelnuovo)をはじめ 多くの人々が連絡をとり合い、彼らの多くが新しい手法を使って中心極限定理の推測をあれこれ考察していた。
しかし、この自由気ままな交流はまもなく終焉を迎えた。スターリンの恐怖政治、ナチスの人 種理論、そしてムッソリーニ帝国の夢想にょる暗い影は、今にもそれを壊そぅとしていた。スタ hリンは見せしめの裁判を仕組んでは深夜の逮捕を行い、スターリンに病的なまでの疑いをかけ られた者は一人残らず殺されたり、脅迫されたりした。ヒトラーや彼の犯罪を支持する者たちは、 (主として)ユダヤ人教授を大学から引きずり出し、残虐な強制収容所へと送り込んだ。ムッソ リーニは「協調組合(主義)国家」と呼んだ独自の社会階級で命運を定め、人々をがんじがらめ にした。
死ょ、万歳!
この反知性主義が蔓延したなかでの極端な例は、スペイン内戦で起こった。そこでは、フアシ ズムとスターリニズムの::.:悪が、勇敢なスペイン青年の生命を犠牲にして性質の悪い代理戦争を していた。フアランへ党(スペインのフアシストとして知られる)は、古代から続くサラマンカ 大学を占領した。ときの大学の総長は、世界的に有名なスペイン人哲学者のミゲル*デ.ゥナム 1ノ (Miguelde unino)で、^時七〇代前半だった。フアランへ党員のミジャン.アストラ イ(Mman Astray)将軍は、以前の戦争で片脚、片腕、片目を失っていたが、新たに占領した集 団を率いるプロパガンダの責任者であった。
彼のモットーは、「死よ、万歳!」であった。シエークスピアのリチャードl世のように、ミ ジャン‘アストライの不自由な体は、彼の歪んだ悪の精神を暗に象徴していた。ファランへ党派 はサラマンヵ大学の講堂で盛大な祝典を行った。演壇には新しく就任した県知事、フランシス コ■フランコ夫人' ミジャン■アストライ、サラマンヵ司教が並び、そして年老いたミゲル■ デ*ゥナムーノが占領の戦利品として演壇の前列へ引っ張りだされた。
「死よ、万歳!」とミジャン■アストライが叫ぶと、人でいっぱいの講堂のなかに彼の声がこだ ました。「エスパーニャ!」と誰かが叫ぶと、「エスハーニャー.死よ、万歳h,」と講堂中が呼応 した。青い制服を着たファランへ党員が一斉に立ち上がり、演壇の上に掲げられたフランコの肖 像画に向かって敬礼した。こうした喚声のなかにありながら、ゥナムーノは立ち上がり、ゆっく りと演壇に向かった。喚声が静まり、彼は静かにこう切り出した。
皆さんは私の言うことに熱心に耳を傾けています。皆さんは私のことをご存知ですし、私 が沈黙しつづけてはいられないことをご存知です。ときに沈黙は嘘をつくことと同じです。 なぜなら沈黙は黙諾と解釈することができるからです"願わくば、ミジャン■アストライ将 軍の演説にコメントしたいと思います。……たった今、「死よ、万歳!」という死を愛する 無意味な叫びを耳にしました。そして、私は逆説を語ることに人生を費やしてきましたが、
私は専門的権威として、この突飛な逆説に我慢ならないことを皆さんに伝えねばなりま
せん。ミジャン.アストライ将軍は身障者です。…彼は戦争傷?者であります。 不幸なことに、今::□スペインにはあまりにも多くの身障者がいます。そして、神がわれわれを救い にこなければ、その数はすぐにも増えるでしよう 。
ミジヤン.アストライはウナム' ?ノを押しのけ、「知性をこき下ろせ! 死よ、万歳^」と大 声で叫んだ。アストライの叫びが響くなか、ファランへ党員たちはウナムーノを捕まえようと前 へ詰めかけたが、老総長は次のように話しつづけた。
ここは知性の聖堂です。そして、私はその高位の同祭です"神聖な構内を汚しているのは あなたがたです。あなたがたは十二分に野蛮な力を持つていますから、勝利することでしよ う。しかし、あなたがたは納得させることはできないでしよう。というのも、納得させるた めには説得が必要となるからです。そして説得するためには、理性と正義が必要となるでし ようが、それらがあなたがたに欠けているからです。
ウナムーノは_宅に軟禁され、その月のうちに「自然死」と発表された。
スターリンの恐怖政治はロシアの数学者と他のョ? ロッバとの音信を遮断し始めた。ヒトラー の人種政策はドイッの多くの大学に大きな打撃を与えた。多くの偉大なョーロッパの数学者はユ ダヤ人かもしくはユダヤ人と結婚しており、ユダヤ人でなくとも数学者の多くがナチスの計画に 反対していたからである。ウイリアム-フェラーはプリンストン大学へ、アブラハム.ワルドは
コロンビア大学へ移った。ハ一マン■ハートレイやリチヤード-フォン-ミーゼスはロンドンへ 行った。エミール-グンベルはフランスへ逃れた。エミー.ネーター (Emmy^oether)はペン シルべニアにあるブリンマー大学の任期つき教Mの職を得た。
しかし、すべての人々が逃れられたわけではない。アメリカの移民局の門は、アメリカでの職 が約束されていない人には閉ざされていた。ラテンアメリカの諸国は了見の狭い官僚たちの気ま ぐれで、その扉を開いたり閉ざしたりしていた。ナチス軍がワルシヤワを制?した際、ワルシヤ ワ大学のすべての教授陣を見つけしだい捕まえ、残忍に殺害して一緒に埋めた。ナチスの人種観 にょれば、ポーランド人や他のスラブ人は教育など必要なく、アーリア人の主人に仕える奴隸と なるべきものだった。ヨーロッバの歴史ある大学で、若く前途有望な学生たちが数多く殺された。 ソ連では、主な数学者は応用のあてのない純粋数学に避難先を求めた。科学者にスターリンの冷 酷な嫌疑がかかるのは、応用分野においてだったからである。
だが、これらの暗い影がすべて現実のこととなる前に、ヨーロッパの数学者たちは屮心極限定 理の問題を解決した"フィンランドのイヤール.ワルデマール-リンデべルグとフランスのポー ル,レヴィが、一部重複するが、中心極限定理が成立するための必要条件の集合をそれぞれ独立 に発見した"この問題には少なくとも三つの異なるアプローチがあり、それは単一の定理ではな く中心極限定理群であって、それぞれは若千異なる条件集合から求められるといぅことがわかっ たのである。一九三四年までには、中心極限定理(群)はもはや推論ではなくなった。人々はリ ンデベルグ=レヴィ条件が満たされているかを証明しさえすればいい。それができれば、中心極限定理が成立し、科学者は適当なモデルとして正規分布を自由に仮定できるのだ。
リンデべルグ==レヴィからU統計量へ
ところが、特定の状況においてリンデべルグ=レヴィ条件が満たされていることを証明するの は難しい"リンデべルグ=レヴィ条件を知っていることは、ある種の安心感がある。なぜなら、 それらは妥当に見え、かつ多くの状況下でたぶん正しいと条件を記述しているからだ。
しかし、それらを証明することとは別問題である。ここで登場する、戦後ノースカロライナ大 学でコッコッと研究していたワシリ!-へフディング(wassilyHoeffding)がこの話の重要人物 である。一九四八年にへフディングは数理統計学霞01〇/ ミCasa憂ics)誌 に論文「漸近的に正規分布に従ぅ統計量のクラスについて(A Class of Statistics with Asymptoti- cally Normal Distribution)」を発表した。
フィッシャーが定義した統計sとは、観測データから求められたものであり、分布の母数の推 定量だったことを思い出してほしい。フィッシャーは統計量が役立つために持つべきいくつかの 基準を定めた。そしてその過程で力ール.ピアソンの方法にょる統計量がこれらの基準を満たさ ないことを証明した。
統計量の計算方法はいろいろあるが、その^^. くはフィッシャーの基準を満たしている"一度統 計量が計算されたら、それを使ぅためにはその分布を知らなくてはならない。もしそれが正規分布であれば、とても使い勝手がよい。へフディングは、彼がru統計量」と呼んだクラスに属す る統計量がリンデベルグ=レヴィ条件を満たすことを明らかにしたのである。それゆえ、リンデ ベルグ=レヴィ条件が成立していることを示すために難しい数学を解く必要はなくなり、新たな 統計量がへフディングの定義に合うかどうかを検証しさえすればよくなった。へフディングはす っかり数学的要件を取って替えてしまったのだ。
実際のところ、へフディングの条件は、チェックが非常に簡単である。へフディングの論文が 発表されてからというもの、新たな統計景が正規分布に従うことを示す論文は、ほとんどすべて がU統計量であることを証明するものとなっている。
ベルリンのへフディング
第二次大戦中、へフディングはあいまいな状況に置かれていた。彼はフィンランドがロシア帝 国の一部であった一九一四年に' フィンランドでデンマーク人の父親とフィンランド人の母親の あいだに生まれた。へフディングは家族とともにデンマークに移り、第一次大戦後はベルリンに 移った。このようにして、彼はスカンジナビアのニ国の市民権を持っていたのだ。
へフディングは一九三三年に高校を卒業すると、ベルリンで数学の勉強を始めた。それはちょ うど、ナチスがドイツで政権をとったときだった。大学の数学科長リチャード■フォン.ミーゼ スは、何が起きるかを予見して早々とドイツを離れた。教わっていた他の教授たちの多くもそれからまもなく亡命するか、職を追われた。混乱のなか、若きへフディングは下級講師の授業を履 修したが、その講師たちの多くは講義を全ぅできなかった。なぜならナチスはユダヤ人教授やユ ダヤ人の肩をもつ教授の「粛清」を続けていたからである。
そのためへフディングはほかの数学科生とともに、ルードヴィッヒ■ビーベル'ハッハ (LudwigBieberbach)の講義に出席するしかなかった。ビーベルバッハはそれまで教授陣のなか で影の薄い存在だったが、ナチス党への熱狂的支持から、新しい学科長の座についた。ビーべル バッハの講義は「アーリア人」と「非アーリア人」の数学の違いを扱っていた。退廃的な「非ア 1リア人(ユダヤ人のこと)」数学者は複雑なアラビア式表記に依存しているのに対し、「アーリ ア人」数学者はょり崇高で、幾何的洞察のょり理論的な領域を研究していることを見出した。講 義の終わりに彼は質問を受けつけ、後列にいた一人の学生がリチヤード.クーラント(Richard Courant:ドイツの偉大なユダヤ人数学者の一人でニ〇世紀初期に活躍した)が実解析の理論を 開発するのに幾何的洞察を用いているではないか、と質問した。それ以後、ビーべルバッハはこ のテーマについて二度と公の場で講義をしなくなった。しかし、彼はドイツ数学誌(bes&c/^ 」\&^0§〇^キ)を0刊し、それはすぐに当局の目に留まる、王要な数学学術誌となった。
へフディングは一九四〇年に他の青年たちが軍に徴兵される年齢で大学での学業を終えた"だ が、彼のあいまいな市民権と、フィンランドがドイツの同盟国であることから徴兵を免れた"彼 は実用科学のために大学間をまたいで設立された研究所の一つに研究助手の職を得た。また、ド イツで最も歴史ある数学雑誌のオフィスでアルバイトをしていた。ビーベルバッハの雑誌とは異なり、どんな雑誌でも紙を調達することが難しく、稀にしか出版できなかった。へフデイングは 教師の職を探さなかった。資格にかなうには正式なドイツ市民権を申請しなければならなかった からだった。
一九四四年に「ドイツ人またはドイツ人の流れを汲む」非ドイツ市民でも兵役につくこととな った。だがヘフディングは、徴兵検査で糖嵌病に罹っていることがわかり、徴兵を免れた。今度 は勤労奉仕には適合した。パートタイムで働いていた雑誌の編集長ハラルド.ゲッぺルト (HaraldGepperoは、軍事的応用に閨する数学的な仕事をするのはどうかと持ちかけた。ゲッ ペルトはもう一人の編集者であるへルマン?シュミット(Hermannschmid)が部屋にいるとき にこの話を切り出した。へフディングはためらったものの、ゲッペルトの思慮深さを信じ、どん な類の仕事であっても軍に関わる職に就くのは自分の良心に反すると告げた。シュミットはプロ シアの貴族の一員だったが、彼の道義にょってこのやり取りがここだけの話になることを、へフ デイングは祈った。
それから数:uのあいだへフデイングははらはらしていたが、何事も起こらず、仕事を続けるこ とができた。ソ連軍が^ってくると、ゲッペルトはある日の朝食で幼い息子に毒を与えそのあ とで彼と妻も服毒自殺したD一 九四五年二月にへフディングは母親とともにハノーバーの小さな 町へ逃げ込んだ。折しもその町がイギリス古領地区となったときだった。父親はベルリンに残っ たが、ソ連の秘密警察にスパイ容疑をかけられ逮捕された。かつてデンマークでアメリカ大使館 の商務アタッシHとして働いたことがあつたからだつた。
父親がやっとのことで刑務所を脱獄して西側へ逃げるまで、家族は何年も父親の消息がわから なかった。その間にも若きへフデイングは研究を続けるため、一九四六年の秋にニューヨークへ 渡り、のちにノースカロライナ大学に招聘され、その教授陣に加わったのである。
オペレ^^シヨン'ス.リサ^ ?チ
ナチスの反知性主義と反ユダヤ主義に対抗して、第二次大戦の連合国側は聡明な科学者や数学 者の才能を結集し、戦争に役立たせることとなった。イギリスの生物学者ピーター.ブラケット (FeterBlackett)は海軍本部に、軍は戦略■戦術上の問題を解決するために科学者を利用できる と進言した。科学者はその摩門分野にかかわらず' 各種問題に論理学や数学モデルを適用するこ とが身についている。ブラケットは戦争に伴う問題を解くために科学者のチームをつくることを 提案した。このょうにしてオペレーシヨナル.リサーチ(アメリカではオペレーシヨン、ス*リサ 1チと呼ぶ)という分野が誕生したのである。
異なる分野からなる科学者チームは、潜水艦に対する長制程爆?の最適使用の決定、対空磁用 の射角表の提供、前線後方の弾薬庫の最適配置の決定、そして兵士の食料補給のょうな問題にま で協力した。
戦後、オペレーシヨンズ.リサーチは戦場からビジネスの世界へ移行した。戦時下で科学者た ちは、どうすれば数学モデルや科学的思考が戦闘での戦術的問題の解決に役立つか証明してみせた。同様のアプローチや多くの同じ手法が、労慟者の仕事の?織化、倉庫と販?店との最適関係 の発見や、限られた資源や生産改善と生産量のバランスに関わるその他多.くのビジネス上の問題 を解決するために使われた。それ以来、オペレーションズ■リサーチ部門が多くの大企業で創設 されている。これらの部門で行われた仕事の大半が統計モデルを含んでいた。ファィザー社に勤 務していたころ、私は複数のプロジェクトに携わった。そのプロジェクトは医薬研究の管理法の 改善や、治験にまで進んだ新製品の改善を目的としていた。この作業すべてにとつて重要なッー ルは、条件にはまりさえすれば正規分布を導き出せることなのである。
一九八?年代に新しいスタィルの数学モデルが登場し、主として「ヵオス理論」という名前の ゆえに人々の興味を惹きつけた。その名前から連想されるのは、非常に手に負えないランダム 性を持つ統計モデルのいくつかの形状である。この名づけ親は、ランダムという単語を使うのを 意図的に避けたのだ。ヵオス理論は実際には、決定論をより洗練させ、復活させることで、統計 軍命をなかったことにしようとする一つの試みである。
統計革命以前の科学が扱ってきた「こと」は、觀測値か、もしくはそれらの観測値を生み出し た物理的事象のどちらかであったことを思い出してほしい。統計革によって、科学上の物事は 観測値の分布を支配する母数になった。初期の決定論的アプローチでは、測定を精緻化すれば考 察対象となる物理的現実のよりよい定義ができるようになるという信念が常にあった。
統計的なアプローチでは、分布の母数はときとして物理的現実を必要としないし、それはどん なに測定システムを精緻化しても推定誤差を伴う。たとえば、決定論的アプローチでは、物体が どのように地上に落ちるかを表す固定された数字、すなわち重力定数がある。一方、統計的アブ ローチでは重力定数の観測値は常に異なり、その分布の散らばりは落下する物体を「理解する」 ために立証できればよいのである。
一九六三年、カオス理論学者のエドヮード■ローレンツ(EdwardLorenz)は講義を行い、よ く引用される「ブラジルで一匹の蝶がはばたくとテキサスで大竜巻が起こるのか」を説いた"ロ 1レンツの要点は、カオスをもたらす数学関数は初期条件にとても敏感であるということである。 初期条件のほんのわずかな違いが、何度もくり返すうちに劇的に異なる結果を導くことがあるの だ。この初期条件のわずかな違いに対する敏感さが、彼の問いかけへの答えを決められない要因 だとローレンツは信じていた。
ローレンツの講義が拠りどころとしているのは決定論の仮定で、各初期条件は最終結果の原因 として理論上は追跡可能であるというものだ。この考え方は「バタフライ効果」と呼ばれ、カオ ス理論の伝道者たちから深遠な真理と見なされている。
しかし、そのような原因と結果が存在しているという科学的証明は一つもない'」そのような結 果を招く現実をうまく立証する数学モデルは存在しないのだ。それは信念を述べているにすぎな い。悪魔や神について語るのと同じくらいの科学的な妥当性しかないのである。科学の探求を分 布の母数で定義する統計的モデルもまた、現実の性質に対する一つの信念に基づいている。私の科学研究の経験からすると、統計的な信念のほうが、決定論的な信念よりも、より真実味がある
よ、っに田?又る
カオス理論と当てはまりのよさ
カオス理論は、ある決定論的な定式から生成された数値にランダムなパターンがあるように見 えるとい、っ観察結果から生じている。これは、ある数学者のグル?プがいくつかの比較的雄純な 式の解析をくり返し、結果をプロットしていくと浮かび上がってくる。第7章で、私は式のくり 返し法について、式を使ってある数値を得、その数値を式に代入して別な数値を得るものとして 説明した。:一番目に得た数値は三番目の数値を得るために使われ、以下同様にして数値を得てい i
ニ〇世紀の初めには、フランス人数学者のアンリ.ポアンカレ(Henri Poincare)がそのよう な数値を次々とグラフにプロットすることで、複雑な微分方程式を理解しようとした。ポアンカ レはこれらのプロットにいくつかのおもしろいバターンがあるのを見つけたが、それ以上どうす ることもできず、その発見を捨ててしまつた。カオス理論はこれらのポアンカレ.プロットから 始まる。ポアンカレ.プロットを実際書いてみるとわかるが、グラフ紙上の点は当初、何の構造 も持たないように見える。それらは一見、デタラメにあちらこちらに点在するかのようだ。だが. プロット図上の点の数が増えるにつれて、パターンが浮かび上がってくる。それはときに平行な直線の群に、または交差する線や円に、さらには直線が横切る円の集合になるかもしれない。
カオス理論の支持者たちが:'小しているのは、実生活で単にランダムな?定として見えることが、 実際にはいくつかの決定論的な式の集合によってつくり出されており、それらの式がポアンカ レ.プロットでaられるバターンから?繹されることである。たとえば、あるカオス理論の支持 者たちはヒトの心拍の時間間隔を測ってポアンカレ.プロットにした。彼らはこれらのプロット からパターンが見えることを主張しており、同じハターンをつくり出しそうに思われる決定論的 生成式を発見してきた。
本書の執筆時点で、このようなかたちでカオス理論を応用するには一つの大きな欠点がある。 それは、デ?タに基づいて描かれたプロットと、特定の式の集合から生成されたプロットを重ね 合わせてみたときの当てはまりのよさを測る物差しがないことである。提案された生成式が正し いという証明は' ニつのグラフを人に見せて同じように見えるか聞くしかない。この目視検定は、 統計解析においては誤りを犯しやすいものであるとすでに証明されている。目視で似ているとか、 ほぼ同じように見えることでも、この目的のために開発された統計手法を使って注意深く検証す るとまつたく異なつていることはよくあるのだ。
ピアソンの適合度検定
これは力ール■ピアソンが研究初期から問題にしていたことだった。ピアソンの偉大な功績の一つは、最初のr適合度検定」をつくり出したことである。観測された数値と予測した数値を比 較することで、当てはまりのよさ(適合度)を検定する統剖Mをつくり出したのだ"
ピアソンはこの検定統計量を用いた検定を「カイニ乗適合度検定」と呼んだ。この検定統計量 の分布が、カイ族と称した歪んだ分布形を持つグループに属していたことから、ギリシャ文字の カイ「^を使ったのである。実際には、その検定統計量の性質がカイ分布のニ乗のようだった ため、「カイ二乗」になった。フイッシャーの立場でいえば、これは統計量なので、確率分布が 存在することになる。
ピアソンは、用いたデータが何であるかにかかわらず、カイ二乗適合度検定統計量は同じ分布 になることを証明した。そして、この統計暈の確率分布を作表し、検定ごとに同じ表を使えるよ うにした。このカイ二乗適合度検定には、フイッシャーが「自屮度」と呼んだ単一の母数が存在 する。フイッシャーがピアソンの研究を初めて批判した一九二ニ年の論文では、ニつの比率を比 較するケースでビアソンが誤った母数の値を用いていることを指摘している。
しかし、理論のわずかj力所が誤っていたからといって、ピアソンの偉大な功績を汚す心配は ない。ピアソンの適合度検定は、現代統計解析を先駆けた主たる柱の;つである。この柱は、 「仮説検定」あるいは「有意性検定」と呼ばれている。これにより分析者が、現実を説明するた めの一,つかそれ以上の競合する数学モデルを提示し、それらのモデルのうち一つを棄却するため にデータを使うことができるようになつたのだ。
仮説検定は非常に広く利用され、多,くの科学者が自分の手に侍ハえる唯一の統計手法と考えるまでになった"だが、仮説検定の使用はいくつかの深刻な哲学的問題をはらんでいる。それについ てはのちの章で触れることにしよう。
検定^^婦人は紅茶の違いを言い当てられるか
ある婦人が紅茶にミルクを往いだものとミルクに紅茶を注いだものの味を見分けられる力どう かを検定したいと考えてみよう。ティjカッフを一;つ用意し、一つは紅茶にミルクを注いだもの で、もう一つはミルクに紅茶を注いだものだと言いながら彼女に差し出す。彼女は味見をし、正 しく違いを言い当てた。勘で言ったのだとしても' こうなることはある。その場合、正しく言い 当てられる可能性は五〇%である。
つづいて別の同じような二つのカップを彼女の前に置く"またもや彼女は正しく言い^てた。 もし、当て推量をしているのなら、連続して;_:回正しく言い当てる可能性は四分の一となる。
彼女の前に三回目のニつのカップを置いて、彼女はまたしても正しく言い当てた"単なる推量 の結果としてこのようなことが起きる可能性は八分の一である。さらにこれをくり返し、正しく 言い当てつづけたならば、ある時点で彼女は違いがわかると言わざるを得ないだろう。
さて彼女が一固間違えたとしよう。それがニ四回目の実験で、ほかはすべて正しかったとした らどうだろう。この場合でも、彼女は違いがわかると結論づけることができるだろうか。ニ四回 のうち四回間違っていた場合は? 二四回のうち五回ではどうだろうか?
仮説検定または有意性検定は、検定しようとする仮説が真であると仮定したうえで、観測した 事象から確率を算出する統計手法である。観浙された寧象の確率がとても小さいときには、仮説 は真でないと結論づける。ここで重要なのは、仮説検定は仮説を棄却する道具であるということ だ。この例で検定しようとしているのは、婦人が当て推量しているだけであろうとい、っ仮説であ る。この仮説が真である確率が非常に高くても、この仮説は受容されないのだ。
この一般概念が出てきた初期のころに、有意という言葉が使われるようになった"それは仮説 が起きる確率が棄却するのに十分なくらいその確率が低いことを示す。もしデータが仮説に立て た分布を棄却するのに役立てば、そのデータは有意となる。この有意という言葉は一九世紀末の 英語の意味で、単に計算された値が何かを表していることを指す。
ニ〇世紀に入ると、有意という言葉はほかの意味を帯びるようになり、現在では何か大変重要 なことを表すところまで広がりつつある。統計解析では"依然としてこの言葉は検定される仮説 のもとで計算された確率がとても小さいという意味で使われている。このように、この言葉には 数学的に厳密な意味があるのだ。統計解析を使っている人々が、有意である検定統計量を、この 現在の意味に近いニュアンスで用いることは、不幸である。
フィッシャーのP値の使い方
フィッシャーは現在一般に利用されている有意性検宛手法の大多数を開発した。彼は有意性を示す確率を「P値」で表した。その意味や有用性について何の疑いも抱かなかった。彼の著書 『研究者のための統計的方法』の多くは、P値を計算する方法の説明に費やされている。前に触 れたように、この本は統計手法を使用したいと考えている数学者以外の人々のために書かれたも のだ。そのなかで、これらの検定がどのようにして導出されるのかについて記述しておらず、P 値がどのくらいの値であれば有意と言えるのか、決してはっきりと述べなかった。その代わりに 計算例を揚げて、結果が有意であるか否かに言及している。一例を挙げよう。フィッシャーはP 値が〇‘〇一より小さいことを示し、次のように述べている。「(計算された検定統計量を)偶然 に超えるのは、!〇〇回に一度であるから、結果の差異は明らかに有意である」。
すべての状況下において、このP値をもって有意とすると定義したかに近い記述を、|九ニ九 年の『心霊研究協会予稿集(FroceedAngs o/^ecoocs'^/or Ps交cミca^aesearc/1)』に所収され た論文に見ることができる。心霊研究が目指しているのは、科学的方法を用いて透視能力の#在 を証明することだ。心霊研究者たちは統計的有意性検定を駆使して、被験者による完全な当て推 mである、という仮説からでは彼らの褐た結果が起こりそうもないことを示した。フィッシャー はこれに対し、この論文で有意性検定を正しく使っていない研究者たちを痛烈に非難し、次のよ うに述べている。
生物学的方法によって生命体の研究をする際には、統計的有意性検定は不可欠である。そ の役割は、研究-検出しようとしている原因によってではなく、われわれがコントロールで
きない多くの複雑な状況から生じた偶然の汗来事に惑わされないようにすることにある。も し見尚をつけているものが真の原因でないために、めったに生じ得ないという場合は、その 観測結果は有意であると判断される。慣例として、偶然によって生じるのがニ〇回の試行の うち:回未満という程度であれば、結果は有意であると判断する。研究の実務に携わってい る者にとってこれは恣意的だが、便利な有意水準である。だからといってニ0回にー回判断 を誤るというわけではない。有意性検定は何を無視したらよいのかを教えてくれるだけにす ぎない"言い換えれば、すべての実験で有意な結果が得られないということだ。かなり高い 頻度で有意な結果が得られるような実験計画を知っている場合、現象は実験的に論証可能で あると主張するにとどめたほうがよい。そのため、再現する方法がわからない有意な結果が ぽつんとあっても' これはあらためて解明されるまで未決定のままなのだ。
「かなり高い頻度で有意な結果が得られるような実験計画を知っている」という表現に注ロしよ う。これはフイッシャーならではの有意性検定の使い方の核心である。フイッシャーにとっての 有意性検定は、特{疋の処理効果の解明を目的とした連続した実験においてのみ意味を持つのだ。
フイッシャーの応用論文に目を通せば、有意性検定を使って三つの可能な結論から一つを得て いると信じるに至るだろう"もし、P値が非常に小さければ(通常〇■〇一未満)、効果がある と一H明する。もし、P値が大きければ(通常〇-HO以上)、効果があったとしてもそれはあま りにも小さくて、この規模の実験では検出できないと言明する"もしP値がこのあいだにあれば、効果がよく得られるために次の実験計画をどのようにすべきか議論する。
さきのニつの言明のほかに、科学者がP値をどのように理解すべきかについてフイッシャIは 明白に述べていない。フイッシャーにとって直観的に明らかに思えることが、読者にとって明ら かであるとは限らないのだ。
有意性検定に対するフイッシャーの考え方は、第18章で再度見直すことにしよう。フイッシャ 1の大失態の一つ、喫煙が健康に有害であることは証明できない、という彼の主張の核心につい てである。しかし、喫煙と健康との関連性について、フイッシャーの痛烈な分析はあとにとって おくとして、一九.二八年に話を移し、当時三五歳だったイェジー.ネイマンを見ていくことにし よう。
イェジー*ネイマンの数学歴
第一次大戦が東ョー口ッバの故郷で勃発したとき、イェジ 不イマンは将来を有望視された
数学専攻の学生であった。彼はロシアへ逃げ' 数学研究をするには辺鄙な地方のハリコフ火学で 学んだ"最新の知識を備えた教師を欠き、戦?のために何学期も講義を諦めざるを得ない状況で、 ハリコフですでに学んだ初等数学をおさらいし、手に入る数学雑誌の論文を探し出しては知識を 積み上げていった。したがってネイマンが受けた正式な数学教育は一九世紀の学生が教わった程 度にとどまり、その後のニ〇世紀の数学は独学したのである。
ネイマンが利用できた雑誌論文は、ハリコフ大学の図書館で、のちにはポーランドの田舍の学 校で見つけることができたものに限られていた。偶然にも、彼はフランスのアンリ.ルべーグ (Henri Lebesgue)による一連の論文に出会った。ルべーグ(一八七五?一九四一)はニ?世紀 初期の数年にわたり、現代数学分析の^.くの基礎的な考え方をつくり出したが、彼の論文は難解 だった。ルべーグ積分やルべーグの収束理論、ほかにもこの偉大な数学者がつくり出したものは すべて、のちの数学者によって単純化され、より理解しやすいものになりつつある。今日、ルべ 1グを原典で読む者など一人もいない。学生はみな、彼のアイデアを、あとに出たわかりやすい もので学ぶのである(
すなわち、イェジー.ネイマンを除^/誰:人として、ルべーグの原論文のみにあたってそれら と格闘し、これら偉大な創造物から輝く光を見出した者などいない。のちのことであるが、ネイ マンはルべーグに心酔し、やがて一九三?年代末にフランスで行われた数学のコンファレンスで ついにルべーグに会う機会を得た。ネイマンによれば、アンリ-ルべーダは無愛想で無礼な人だ ったらしい。ルべーグはネイマンのひたむきさに対してぶつぶつ言って反応し、ネイマンが話し ている途中で踵を返して立ち去ってしまったのだ。
ネイマンはこのすげない態度に深く傷つけられたが、たぶんこれを反面教師としていたのだろ う。若い学生たちに対して丁寧かつ親切であり、話していることを注意深く聞き、熱意を引き出 すように常に心がけていた。これがイェジー.ネイマンという人である。彼を知っているすべて の人が、彼が親切で思いやりのある人だったと記憶している。愛想がよくて思慮深く、心から喜んで人々と接していた。私がネイマンと会ったとき、彼は八〇歳をわずかに上回っていたが、こ ざっぱりとした,日いロ髭を生やし、小柄で品格のある、身だしなみのよい人であった。人の話を 聞くにつれ、また会話に夢中になるにつれ、彼の青い瞳は輝いた。そしてどんな人であったとし ても同じように注意を払っていた。
駆け出しのころ、ネイマンはワルシャワ大学の下級教員の職をなんとかして見つけようとして いた。当時新たに独立国家となったホーランドは学術研究を支える資金がほとんどなく数学 者の職はとりわけ少なかった。一九二八年、彼はひと夏をロンドンの生物測.足研究所で過ごし、 エゴン‘ピアソンと妻.のアイリーン、そして娘たちニ人と知り合った。エゴンは力ール.ピアソ ンの息子だったが、そうとわからないほどはなはだしく対照的な性格だった。力!ルが人をこき 使い支配的であったのに対し、エゴンはシャイで自分を表に出さない人であった。力ールは新し いアイデアが浮かぶと、しばしば数学的にあいまいなところがあっても、概略のまま、あるいは 複数の誤りがあるままで論文を出すような性急なところがあった。反対に、エゴンはきわめて慎 重で、細かい計算一つ一つにも気を遣っていた。
エゴン.ピアソンとイェジー*ネイマンとの友情は一九二八年から三三年にかけて交わされた 書簡に残されている。この書簡は、一人がアイデアを出せばもう一人がそれに批評を交えるかた ちで、いかにして二人の知性が!つの問題に取り組んできたかという、科学の社会学にとって晃 事な見識をもたらしている。
エゴン.ピアソンの自分を表に出さない性格は、ネイマンの提案に対して、うまくいかないか
もしれないとおずおずと指摘する姿勢からにじみ出ている。他方、ネイマンの偉大な独創性は、 複雑な問題を切り分け、それぞれの難しさの根本的な性質を突き止めょうとする様子から溢れ出 ている。数学で共同研究があまりにも多いのはなぜなのかを理解したい人に、私はネイマンnピ アソンの書簡を薦めたい"
エゴン.ピアソンがネイマンに最初に提案したのはどんな問題だろうか。ここでカール■ピア ソンのカイ二乗適合度検定を思い出してほしい。力ール*ピアソンは観測データが理論上の分布 と合うかどうかを検定するためにこの検定を開発した。典型的なカイニ乗適合度検定というもの は実際には存在しない"ある所与のデータセットに対してこの検定を適用するために、分析者は 無数の方法が利用できる。これら多くの選択肢からどうやって「最良」のものを見つければいい のか、何の基準もないょうに思えた。検定を適用するたびに、分析者は適当な選択をしなければ ならなかつた。エゴン■ピアソンはイェジー.ネイマンに次の問いを投げかけている。
もし、データセットが正規分布に従うかどうかを検定するためにカイ二乗適合度検定を適 用して、有意なP値を得られなかつたとき、データが正規分布に本当に当てはまっているか を知ることなどできない。すなわち、別のかたちのカイ二乗検定や未知の別の適合度検定が 有意なP値をもたらさず、データが従う〔確率〕分布が正規分布であるという仮説を棄却で きないかもしれない、ということをどうやつて知ることかできるだろうか。
ネイマンの数学のスタイル
ネイマンはこの問題をワルシャワに持ち帰り、そして書簡のやり取りが始まった。ネイマンと エゴンの両者ともフイッシャーの尤度関数に基づいた推定の考え方に感銘を受けていた。彼らは 適合度検定と結びついた尤度を考察することから研究をスタートさせた。最初の共同論文はこれ らの研究結果を著したものである。
この論文は、有意性検定の考え方全体に革命をもたらした、ーー人の三本の有名な論文のなかで も最も難解なものだった。この問題を考察するにつれ、ネイマンの偉大ともいえるビジョンの明 確さは問題からその本質的な要素を抽出しつづけ、研究はより明確に、より理解しやすいものに
なっていった。
読者は信じないかもしれないが、数学研究では文体が重要な役割を果たしている。数学者のな 力には理解しやすレ^文を書くことかできない者か^なからずいるように思える。他方記号を 使った表記に多くの行を費やすことに細かいところまでこだわるあまり、一般概念がつまらない ものに紛れてしまうということにひねくれた喜びを覚えているかのような学者もいる。そうかと 思えば、その成果が説明のなかで明らかにわかるような説得力と単純さで複雑な考え方を表現で きる学者もいる。突き止められたことを読みなぞるだけで、読者にも結果の凄さがわかるのだ。 そのような学者がイHジー.ネイマンである。彼の論文を読むのは楽しい。考え方は自然に展開
されており、記法もいとも単純で、結論はあまりに当然なので、なぜこれらの結論がもっと前に 得られなかったのかがわからないほどである。
私がニ七年間勤務していたファイザー中央研究所では、例年コネチカット大学の学術セミナー を後援していた。コネチカット大学の統計学科は、生物統計学に多大な功績を収めた人物を 一口 招いて学生と会談してもらい、午後遅くには講演をしてもらうことになっている。私はこのセミ ナーの立ち上げに関わっていたので、これらの機会を通じて統計学の偉人たちの何人かとお目に かかる栄誉を得た。イヱジー■ネイマンはそのような招待者の一人であった。彼は講演を独特な 形式で行えないかと頼んできた。ネイマンはまず論文を報告し、その後、彼の論文を批評したい 人々によるパネル.デイスカツションを行いたいと考えていた。高名なイHジー■ネイマンのた っての願いだったので、シンポジウムの主催者はパネルのメンバーを揃えるために、ニユー.*イ ングランド地区の著名な年配の統計学者に声をかけた。直前になって、パネリストの一人が出席 できなくなり、私はその代わりを務めるように頼まれた。
ネイマンはパネリストに報告予定論文のコピーを送ってくれた。それはおもしろい事実であり、 そのなかで彼は一九三九年に行った研究を天文学に応用していた。私は;九三九年の論文を知っ ていた。以前、まだ大学院生だったときにそれを見つけ、印象に残っていたのだ。その論文はネ イマンが発見した新しい星雲の分布を扱っており、その分布を「集中分布(cont.agiousdist.ribu- tion)」と名づけていた。
その論文で取り上げられた問題は、土中の幼虫の発見をモデル化するところから始まっていた。
雌の虫が卵を抱えて野原を飛び回り、産卵する場所をランダムに選ぶ。いったん、.卵が産みつけ られると幼虫が孵化し、その場所から道い出てくる。土の標本がその野原から抽出されるとしよ う。その標本屮に見つかる幼虫の数の確率分布は何だろうか。
集中分布はそのような状況を表すものである。それらは一九二九年の論文に、いとも簡単な式 から導き出されている。その導出は自明かつ自然であるように思える。読者が論文の最後までた どっていったとき、それ以外のアプローチがないことは一目瞭然である。しかし、これはネイマ ンの論文を読んだからこそなのだ。一九U一九年の論文以来、ネイマンの集中分布は医学研究、冶 金学、気象学、毒物学、そして(ネイマンがファイザー研究セミナーの論文で示したように)宇 宙の星雲の分布を扱うときなど、非常に多くの状況でその適用例が見られる。
ネイマンは報告を終えたあと、パネリストの討議を聞くために席に戻った。私以外のパネリス トは、前もって彼の論文に目を通せないほど忙しい著名な統計学者たちだった。彼らはファイザ 1研究セミナーを、ネイマンに栄誉を与える一つの表彰の場と見なしていた。彼らの「討議」は ネイマンの経歴や過去の業績についてのコメントばかりだった。私は直前に代役としてパネルに 加わったので、ネイマンとともに経験した(ありもしない)過去について触れることはできなか った"私は彼が求めていたように、その日の報告に対してコメントした。特に、以前どうやって 一九三九年の論文を見つけたのか、そしてこのセッションのためにどう読み返したのかを話した。 私は筆苦を尽くして、ネイマンがその分布の母数の意味を展開させてきた賢明な方法に自らがた どり着いたときの興奮をr小しながら、その論文を概説した"
ネイマンは私のコメントに明らかに喜んでいた"そのあと、われわれは集中分布とその利用に ついての刺激的な議論の場を持つことができた。数週間後、大きな荷物が届いた。それはカリフ ォルニア火学出版会から刊行されたf J .ネイマンの初期統計論文選集(A Selection of Earl^ Statistical Papers of J. Neだman)』といぅ本だった。その本の表紙の裏にこぅ記されていた.u 「デイヴィッド■サルツブルダ博士へ、一九七四年四月三〇ロの報告への興味深いコメントに心 から感itの意を込めて。^~',ネイマン」
この本は' ネイマンの直筆の献辞とそこに収録された美しく洗練された論文とともに私の宝物 である。それ以来、私は多.くのネイマンの学生たちや共同研究者たちと話す機会を得ている。一 九七四年に私が出会った、親近感があっておもしろく、かつ興味を惹かれる人物は、巷で言われ ているとおりの人物であった。
エゴン.ピアソンとイェジー■ネイマンが兵同研究を始める際に、ピアソンがネイマンにこう 尋ねた。
「一組のデータに対する正規性の検定において、もしP値が有意とならなかったら、データが正 規分布に従っているとどうやって確信したらいいだろうか」
彼らの共同研究はこの問いかけから始まったが、しだいにこの共同研究は、「?意性検定で、 有意でない結果を得たときは何がいえるのか」「ある仮説が間違いだといえなかったとき、その 仮説が正しいと結論づけることができるのか」へと発展していった。
フィッシャーは、この問題に遠まわりな方法で取り組んでいた。データから計算されたP値が 大きな値をとるすなわち有意にならないというのはそのデータ自体ガ有意となるには不十分
だと考えた。つまり、フイッシャIにとって有意でない結果を得たということは検定された仮 説が正しいことを裏づける根拠にはならなかったのである。フイッシャーはこう言っている"
ある仮説が扱うことのできる事実に矛盾していないという理由だけで、その仮説の正しさ が証明されたと信じるような論理的誤謬は、統計的な論拠においても、その他の科学的な論 ?においても、受け入れられない。……それゆえ、有意性検定で、データが仮説に矛盾する 場合には仮説を棄却したり無効にしたりできるが、矛盾しない場合には仮説が正しいとはい えない、と一般に広く理解されたならば、有意性検定の明快さは大いに増すだろう。
力ール-ピアソンは、データが特定の分布に従、っことを「証明する」ために、自ら提案した力 イ二乗適合度検定をよく使っていた。だが、フイッシャーがより論理的な厳密さを数理統計学に 導入すると、力ール.ピアソンの方法はもはや受け入れられなくなった。しかし最初の問題はそ のままであった。というのも、データがある特定の分布に従うという仮定が必要だったからだ。 その仮定は、:Eの前にある科学的な問題にどの母数がどのように関連しているかを推定し決定す るためにも知っておかなければならなかった。統計学者たちはそのことを証明するために有意性 検定をよく使ったのである。
エゴン-ピアソンとイェジ?:不イマンは書簡を通じて、有意性検定から導かれたいくつかの パラドックスを検討した。たとえば有意性検定の間違いやすい使い方で、本当は正しい仮説を棄
13.5 第11章仮説検定
却してしまう場合などである。フイッシャーは決してこれらのパラドックスに陥らなかつた。有 意#.検定が間違って使われていることが、彼には明白だったからだ。
ネイマンは、どんなときに有意性検定が正しく適用されるのかを決定するにあたって、どんな 基準を使うべきかを問うた。二人は手紙のやり取りのほかにも、ネイマンが夏のあいだにイング ランドを訪ねたりピアソンがポ?ランドを訪ねたりして、徐々に仮説検定の基本的アイデアをつ くり上げていった。
仮説検定におけるネイマンHピアソンの公式の一番簡単なかたちは、今やすベての初等統計学 のテキストに見られる。.その公式は単純な構造である。たいていの大学I年生にたやすく理解さ せることができる。定式化されているので、この公式は厳密であり、かつ教えやすいのだ。テキ ストのとおり、これがまさに仮説検定のやり方そのものであり、また唯一の方法でもある。仮説 検定に対するこの厳格な方法は、アメリカの食品医薬品局や環境保護局などの規制当局でも受け 入れられており、またメデイカルスク?ルで将来の医学研究者に対しても教えられている。また、 ある種の差別訴訟を扱う場合の法的手続きにおいても、この方法が浸透しつつある。
ネイマン=ピアソンの公式がネイマンの開発した厳密かつ簡単なかたちで教えられるとき、そ の公式を誤って解釈すると、彼の発見を曲解することになる。ネイマンの主たる発見は、少なく ともニつの可能な仮説がなければ有意性検定が合理的でなくなるというものだからだ。たとえば、 データが正規分布に従うかどうかを検定するとしょう。その際、適合するだろうと思われる他の 分布もしくは分布群がなけれならないのだ。こうした対立仮説の選択が有意性検定に影響を及ぼ
すのである。その対立仮説が正しいと導きmされる確率を、ネイマンは検定の「検出力」と名づ けた。
数学では、具体的な概念に明確な名前を与えることで思考が明快になる。そこでフイッシャー の^1値を計算するために使われる仮説とそれ以外の可能性のある仮説とを[><別するのに、ネイマ ンとピアソンは名前をつけた。検定されるべき仮説を「帰無仮説(rmuhypothesis)」、それ以外 の仮説を「対立仮説(alternative hypothesis)」と呼んだのである。彼らの公式において、P値 は帰無仮説を検定するために計算されるが、対立仮説が実際に正しいと仮定した場合にはP値か ら検l[i.'r力が求められる。
このことからネイマンは:::つの結論に達した。一つは、検定の検出力はその検定がどれほど優 れているかの尺度であることだった。つまり、ニつの検定のうち検出力のょり大きいほうの検定 を使うのが、ょり適切なのである。もう一つの結論は、対立仮説の集合をあまり大きくすること ができないということである。データの解析者は、そのデータが正規分布から得られた(帰無仮 説)か、もしくはそれ以外の可能性のある分布から得られた、とは断定できない。すなわちそれ は、あまりにも対立仮説の集合が広すぎて、可能性のある対立仮説すべてに対して強力な(検出 力の大きい)検定というものは存在しないからなのである。
一九五六年に、シカコ大学のL ■ _?一■サヴェッジとラージ*ラグー■、ハハデュール(Raj Raghu Bahadur)は、仮説検定で帰無仮説が棄却されるためにはそれほど広い対立仮説の集合を とる必要がないことを証明した。どんな検出力を持つ検定に対しても比較的小さな集合の対立仮
説を立てた。一九五?年代にネイマンは、制限された仮説検定のアイデアを発展させて、対立仮 説の集合がかなり狭く定義されるような検定を考えた。そして、そのような検定がより広範囲の 対立仮説集合を扱うものよりも検出力が高いことを証明した。
多くの場合、仮説検定は架空の敵である帰無仮説に対抗して使われる。たとえば、臨床試験で ニつの薬を比較するときを考えてみよう。検定される帰無仮説は、二つの薬の効き目は同じであ るというものだ。しかし、これが本当なら、その比較は決してなされないだろう。一;つの薬の効 果が同じであるという.帰無仮説は架空の敵であり、比較検討の結果から棄却されるべきものであ る。だからネイマンによれば、得られたデータから架空の敵を倒し、薬の効果がどれほど違うか を示すために、データの検出力が最大になるような比較検討を計画すべきだ、となるのである。
確率って何?
不幸なことに、内的整合性のある仮説検定の数学的アプローチを開発するためにネイマンは、 フイッシャーが絨毯の下に追いやった問題を扱わなくてはならなくなった。これが、ネイマンの 巧みで純粋な数学的解決にもかかわらず、仮説検定を苦しませつづけている問題であり、また一 般に統計的手法を科学分野に適用する際の問題でもある。より一般的には、次の質問に集約でき る。「実生活に確率を当てはめたとき何がいえるのか」。
統計学の数学的公式は確率を計算するのに使われる。こうして導き出された確率によって、統
計的手法を科学的問題に適用できるのだ。数学の専門用語で確率はうまく定義されている。だが、 この抽象的な概念は現実とどのように結びついているのか。何が本與で何が本当でないかを決め ようとするとき、統計解析において確率で表現されたものを、科学者はどのように解釈すればい いだろうか。本書の最終章で':般的な問題とそれに答えるべくつづけられてきた多くの試みを 考察するつもりである。しかしさしあたり、ネィマンが彼なりの答えを見つけようとした具体的 な状況を見ていくことにしよう。
フィッシャーの有意性検定は、彼がP値と呼んだ値をつくるためだったことを思い出してほし い。これは計算された確率、すなわち帰無仮説が正しいと仮定したときの観測データから導き出 された確率である。たとえば、乳房切除手術を受けた乳がん患者の冉発防止用新藥を、プラシー ボ〔sp?tt^&£lslluと比較したいとしよう"その際、架空の敵である帰無仮説は、その 新薬はフラシーボと効き目は変わらない、ということになる。五年後フラシーボを投与された 女性患者の五〇%が乳がんを再発し、新薬では一人も再発しなかったとしたらどうだろう。これ は新薬が「有効である」ことを証明しているのだろうか。当然ながら、五?%が表す患者数の多 さによって答£は異なる。
この研究で新薬投与とブラシーボ投与の両グループにたった四人の女性患者しかいなかったと すると、合計八人の患者のなかで二人が乳がんを再発したことになる。適当な八人グループのう ちの二人にタグをつけて、八人を二つのグル!プへ四人ずつランダムに分けたとしよう。このと きタグをつけた二人が同じグループに入る確率は約〇■四である。各グループとも四人の女性患
者だから、プラシーボ.グループにのみ再発患者が二人出ても、有意とはならない。
もしも各グループに五??人の女性患者がいたとしたら、その新薬が有効でない限り、プラシ hボ.グルーフにニ五〇人もの再発患者が出ることはまずあり得ないだろう。新薬がプラシーボ と効き^;が同じだと仮定して、ニ五〇人の再発患者が一つのグループから発生する確率はP値で あり、その値は計算すると〇.00〇一以下である。
P値は一種の確率であり、また計算方法でもある。このP値は計算されると、(帰無)仮説が 棄却されるのを示すのに使われるが、本当は何を意味しているのだろうか。確かにP値はたいて い棄却されそうな条件下で観測値に関連した理論的な確率ではあるが、現実とはなんら関係がな い。それは、もっともらしさを測る間接的な尺度だが、薬が効いているという仮定が間違ってい る確率ではない。また、いかなる棟類の誤差の確率でもなければ、ある患者にとってブラシーボ でも新薬でも同じ効きmがあるような確率でもない。だが、どんな検定が他の検定よりもより優 れているかを判断するためにネィマンは、検定によってなされる決定に伴う確率が計算されうる ような枠組みのなかで仮説を検定する方法を探さねばならなかった。すなわち、仮説検定のP値 を実生活と結びつける必要があったのである。
頻度論による確率の定義
一八七ニ年にィギリスの哲学者ジョン■ヴHン(John Venn)は、実生活において意味のある
数学的確率の公式を提案した。彼は確率の主要な定理を逆から見てみた。その定理は大数の法則 というもので、ある事象の起こる確率が事前にわかる場合(たとえば一つのサイコロを投げたと きに六の目が出るようなもの)' 独立な試行をくり返し行ったとすると、その事象が起こる回数 の比率がその確率にだんだん近づいていくであろう、というものだ。
ヴヱンは、与えられた事象に伴う確率は、長期にわたってその事象が起こる?数の比率に等し いと述べた"ヴHンの提案によれば、確率の数学的理論から大数の法則が得られるのではなく、 大数の法則から確率が得られることになる。これが頻度論による確率の定義である。一九ニー年 に、ジョン.メイナード■ケインズ(John Maynard Keynes 1は、単なる有意義な解釈にすぎな いとして、この頻度論による確率の定義を打ち砕いた。確率が^き合いに出されるケースの多く が頻度論の定義を適用できない根本的な矛盾を示したのである。
形式的な数学的方法で仮説検定を構築しようとしたネイマンにとって、ヴェンによる頻度論の 定義は最後の頼みの綱だった。ネイマンはこれを使い' 仮説検定におけるP値の自らの解釈を正 当化した。ネイマン=ピアソンの公式では、科学者はある固定された定数??たとえば0-0五 のようなもの^を定め、有意性検定でのP値が〇?〇五以下のときはいつでも帰無仮説を棄却 する。この方法によれば結局、科学者は検定する回数のちょうど五%の割合で真の帰無仮説を棄 却することになるぐ
?在教えられている仮説検定の方法では、ネイマンがすがった頻度論のアプローチが重要?さ れている。その方法はあまりに簡単である。そのため、仮説検定におけるネイマンnピアソンの
公式を確率に対する頻度論のアプローチの一部と見なすことができなくなっている。そればかり か、ネイマンのより重要な洞!g??架空の敵である帰無仮説を検定するためにうまく定義された 対立仮説の集合が必要であるという洞察??を認識できなくなっている。
フイッシャjはネイマンの洞察を誤解した。有意水準の定義にとらわれるあまり、検出力の重 要なアイデアや対立仮説集合の定義の必要性を見過ごしたのだ。ネイマンを批評してフイッシャ 1はこう書いてVる。
ネイマンは、「自然認識の増大」の手段として有意性検定における私の初期の仕事を修正 し、改良しようと考えていたのだろう。だが実際のところ、受容手順として知られている技 術的かつ商業的な;つの道具として再解釈したにすぎない。さて、受入手順は現代社会にお いてとても重要なものである。イギリス海軍のような大きな組織が工場から商品を仕入れる とき、欠陥品や不良品の受入をなるベく減らすためにかなり注意深く点検がなされると、私 は考える。……しかし、受入手順という操作と、物理的■生物学的な実験による科学的発見 の成果とのあいだに大きな論理的違いがあると思えるので、両者の類似性は役に立たないう えに、同一視するのは完全に間違っている。
ネイマンの基本的なアイデアへのこういった曲解にもかかわらず、仮説検定は科学的研究で最 も広く使われる統計ッールになっている。ネイマンの中し分のない数学は、今や、科学の多くの
分野で固定観念となりつつある。たいていの科学学術誌は論文の執筆者にデータ解析で仮説検定 を加えるように求めている。
そうした要求は科学学術誌にとどまらない。たとえば、アメリカ"カナダ、ヨーロッバの医薬 品規制^局も、報告書に仮説検定の使用を要求している。また、裁判所も立証の適切な方法とし て仮説検定を認めてきており' 原告側が就職差別を明らかにするために仮説検定を認めている。 仮説検定は統計科学のあらゆる分野に浸透しつつある。
ネイマンnピアソン公式が統計学の頂点に至るまでのプDセスは、なんの疑いもなく受け入れ られてきたというわけではなかった。フイツシャーは、その公式が発表されてから自分が死ぬま で、ひたすら攻撃しつづけた。一九五五年、フイッシャーは王立統計学会誌に論文「統計的方法 と科学的掃納法(statisticalMethods and Scientific Induction)」を発表し、それを拡張して彼の 最後の著書『統計的方法と科学的推論^aassicazMe?ods cmdcos.i/'sc M/eresce)』を刊行 した。また、一九六〇年代の終わりごろ、のちにバイオメトリ力誌の編集長となるデイヴイッ ド■コックス(David COX)が、仮説検定を科学でどのように応用するか明確な解析結果を出版 した。そのなかでコックスは、ネイマンの頻度論的解釈は実際に検定を行うには不適切であるこ とを示した。一九八〇年代には、W .エドヮーズ,デミング(W.EdwardsDeming)が"仮説検 定全体のアイデアはばかげていると攻撃した(統計学へのデミングの影響については第24章で述 ベる)。このように長年にわたつて、統計学のテキストに貼りついたようなネイマン=ピアソン の公式に、新たな間違いを見つけたと主張する論文が、統計学の学術誌に現われつづけている。
ネイマン自身は、仮説検定におけるネイマン=ピアソンの公式の神聖化に手を貸さなかつた。 一九三五年という早い時期に、フランスのBu?一etin de laSocieteMathematigue deFmnce誌に 掲載された論文で、ネイマンは最適な仮説検定が得られるかどうかに深刻な疑いを提起した。そ の後の論文において、めったに仮説検定を直接使わなかった。彼の統計的アプローチはたいてい 確率分布から理論的原理を導き出し、デー夕から母数を推定するというものだった〔_か^^fぱ
ので--,0 ぁる」
ほかの人たちはネイマン=ピアソンの公式の背後にあるアイデアを取り入れて、それを発展さ せた。第二次大戦屮、アブラハム■ワルドはヴェンの頻度論的定義によったネイマンのアプロー チを拡張することで、統計的決定理論の領域を発展させた"エリック-レーマン(Erich Lehmann)は、よい検定のための新しい基準を提案し、一九五九年には仮説検定に関するテキ ストの決定版を書いた。そこで、ネイマン=ピアソンの仮説検定に関する最も完全な記述を行っ た。
ヒトラ?がポーランドを侵略~ンて3j ロツハ大陸に邪悪な力ーテンが']'りようとしているころ、 ネイマンはアメリカに移住し、カリフォルニア大学バークレー校で統計の講義を始めた。一九八 ー年に亡くなるまでそこで暮らし、世界で最も$要でアカデミックな統計学科の一つをつくり上 げた。
ネイマンは自分の学科に、その分野で著名な研究者を招き寄せるとともに、優れた研究成果を 出しながらも3の^一を見ない研究者も引き抜いた。たとえば、デイヴイツド■ブラックウェル
(DavidBlackweeは、ハヮード大学で孤独に研究していて、ほかの数理統計学者からは孤立し ていた"彼の類いまれなる才能とは関係なく、人種という問題が力べとなって、r,H人」の学者 たちと話し合うことができなかつたのである。ネイマンはフラックウエルをハ一クレーに招き又 れた。さらにフランスの小作農の出である大学院生ルシアン' ル.カム(Lucian Le earn)も 呼び寄せた。彼は、世界をリードする確率論学者の一人になった。
ネイマンは学生や同僚の学科教官にいつも気を遣った。彼らは午後の学部でのお茶会が楽しか ったと述べている。その会はネイマンが礼儀正しく親切に議長を務めていた。学生もしくは同僚 を優しく促しては最近の研究を発表させ、部屋のなかをにこにこしながらゆったりと歩き回り、 コメントをしたり議論を促したりした。お茶会の最後にはょく、自分のカップを高くかかげて 「女性のみなさんに乾杯!」と言った。ネイマンは、とりわけ女性に親切で'女性としてのキャ リアを積むょうに励ました。彼の弟子で突出していた女性の一人に、エリザベス■スコット (EUNabethscoE博士がおり、ネイマンとともに仕事をし、天文学から発がん現象や動物学に またがる論文の共著者であった。同様にエベリン-フィックス(EvelynFix)博士は疫学に大き な貢献をした。
フイッシャーがー九六二年に亡くなるまで、ネイマンはこの厳しい天才から絶え間ない攻撃に さらされていた。ネイマンの仕事はすべて、フィッシャーの酷評のまたとない餌食であった。あ るフィッシャー主義者の不明瞭な記述に対して、ネイマンが証明をつけ加えることに成功したと きには、フイッシャーはそのフイッシャー主義者が書いたことをネイマンが誤解しているといつ
て攻撃した。また' あるフイッシャー主義者のアイデアを拡張したときには、その理論を役に立 たない溝に捨てたと言ってネイマンを攻撃した。ネイマンはこの植の攻撃に論文を使って反馼す ることはなかったし、ネイマンの共同研究者たちの言葉を信じれば、私的に反論することもなか
った。
亡くなる前のインタビューでネイマンは、国際会議においてフランス語で論文を発表した一九 五〇年代のある時のことを述べている。ネイマンは演壇に上ろぅとしたとき、聴衆のなかにフイ ッシャーがいることに気づいた。論文を発表しているあいだ、おそらく来るだろ、っ攻撃に強い決 意でのぞんでいた。フイッシャーが論文のなかの此一;細なさして重要でない点をHざとく見つけ、 自分と論文とをとことんやっつけるだろぅと思っていた。
ネイマンは発表を終えると、聴衆からの質問を待った。しばらく待ったが、フイッシャ?は微 動だにせず、一言も発しなかった。あとになって、ネイマンは気がついた。フイッシャーはフラ ンス語がしゃべれなかったことを。
一九八o年代にエィズ(AIDS =後?性免疫不全症候群)が流行したとき、多くの疑問に答 えなければならなかった。いったんヒト免疫不全ゥィルス(HIV)が病原体として同定される と、衛生崔局はこの流行に対処するための方法-手段を策定するために、どれほど多くの人が感 染しているかを知る必要があったのだ。幸いなことに、疫学の数学的モデルは、ここニ〇年から Ho年のあいだに発展していたのでこの問題に適用できた。
感染症に対する現代の科学的見方は、病原体にさらされた人のぅちの何人かが感染し、「潜伏 期間」が過ぎたあとで、感染した者が発症する、といぅものである。ひとたび感染した者は、ま だ感染していない人たちにとって潜在的な感染源となる。誰が病原体にさらされて感染したのか、 また誰を感染させるのか、を予測する方法はない。その代わりに、確率分布を使って分布の母数
を推定するのである。
母数の一つに平均潜伏期間、つまり感染から発症までの平均時間がある。これはエイズの流行 に対処する公衆衛生肖局にとって、きわめて重要な母数だった。どれだけの人がエイズに感染し て発症したかわからなくても、平均潜伏期間を知っていれば、平均潜伏期間と発症した人の数と を結びつけて感染者数を推定することができる。
その、っえ、Hイズの感染経路の異常さのゆえに、公衆衛生当局は、感染時期も発症時期もわか っている一群の患者を把握していた。その患者とは少数の血友病患者である。彼らは、汚染され た非加熱の血液製剤を通じて幵1\に感染していた。彼らにょって、平均潜伏期間の母数を推定 するためのデータが#られた。
この推定はどれほど正しかったのか。疫学者は、フイッシャーの意味で最良の推定量を使った と主張した。その推定量は一致性があり、有効性も持ち合わせていた。起こりうる偏りを正すこ とさえ可能だったので、推定量が偏りのないものであると?|-張した。しかし前の寧で指摘したょ うに、特定の推定量が真に正しいかどうかを知る術はない。
その推定量がきっかり正しいといえないならば、母数の真の値にどれだけ近いかをいうことは できるのだろうか??この疑問に対する答えは区間椎定量の使用にある"点推定量は一つの数で ある。たとえば、血友病の研究から得られたデータを使って平均潜伏期間を五.七年と推定する のだ。一方、区間推定量では、平均潜伏期間は三.七年から一二.四年のあいだとなる。たいて いは区間推定量のほうが適切な場合が多い。というのも、望まれる公共政策においては、区間推
定量の両端の値に対してほとんど同じ政策がとられるからだ。
ごくたまに、区間推定が広すぎて、最大値と最小値で公共政策が異なる場合もある。あまりに も広い区間から得られる結論はこぅなる。入手した情報から何かを決定するのは適切ではないの で、たとえば調査の対象を広げたり、別の実験に携わったりして、情報をもっと集めるべきなの だ。
たとえば、エイズの平均潜伏期間が最大値である一二-四年と長ければ、感染者のほぼニ0% が感染してからエイズを発症するまでに二〇年以上かかる。逆に平均潜伏期間が最小値である 二.七年ならば、感染者のほぼ全員が一;?年以内にエイズを発症することになる。この二つの結 果はあまりに異なっているため、十把一絡げの公共政策では最適とはならず、さらなる情報が求 められるのだ。
一九八〇年代も終わりになって、アメリカ科学アカデミーは国内の著名な科学者にょる委員会 を?集した"有害な紫外線から地球を守る超層大気上のオゾン層が、エアゾール-スプレーに 使われているフロンガスにょって破壊されている可能性を調査するためだ。その疑問にイエスか ノ?^で答える代わりに、委員会(委員長はション.テユーキーで本書の第22也早の主人公であ る)は、ある確率分布でフロンガスの影響をモデル化することに決め、年ごとのオゾン平均変化 率を区間推定で計算した。その結果、得られた少ないデータから計算された'区間推定量の最小値 を使ってですら、五〇年以内に人類が深刻な脅威にさらされるほど、オゾン層が年々減少してい ることがわかつたのである。
区間推定は今や、ほとんどすべての統計解析に浸透している。ある世論調査で、国民の四四% が大統領は職務を立派に遂行していると思うと答えたとき、この数値が「プラス.マイナス三% の誤差」を持つことが脚注に記されている。この数値が意味するところは、調査対象者の四四% が大統領の仕事ぶりを認めているということだ。しかし、この調査はランダムなものなので、求 められる母数はこのように考える全国民の比率となる。標本サイズが小さいことから、合理的な 推測は、母数は四一% (=四四マイナス三)から四七% (=四四プラス一二)のあいだになるので ある。
そうすると、次のような問題が生じる。どうやって区間推{疋を計算したらいいのか。どのよう に区間推定を解釈すればいいのか。区間推定に関してその確率的な記述はできるのか。母数の真 値は本当にその区間内にあるのか"
ネイマンの解決法
一九:U四年、イHジー.ネイマンは王立統計学会で「代表的方法の二つの異なる見方につい て」という演題で講演した。論文は標本調査の解析を扱っていた。それは、彼の仕事のなかで最 もエレガントなもので、簡単な数学的表現を導いたものだった。ネイマンがこれを得たので直感 的にわかりやすくなったのである。
この論文の最も重要な部分は付録で、ネイマンはそこで区間推定を導く簡単な方法やその推定
の正確性を測るわかりやすい方法を提案した"ネイマンはこの新しいやり方を「信頼区間」と名 づけ' 信頼区間の両端を「信頼限界」と呼んだ。
議長のA - L *ボゥリー教授は席から立ち上がり、感謝の決議を呼びかけた。まず論文の本文 について少し議論したあと、問題の付録へと移った。
説明を求めるべきか疑いをかけるべきか、私にはわからない。論文で提案されていること は難解で、おそらく私は勘違いしているうちの一人だろう(この寸評のあとで、ボゥリーは 一つの例を解き、ネイマンの提案がはっきりわかったと述べている)。私はこの論文が出た ときに一度読み、昨Hふたたび注意深く読み返して、ネイマン博士の解明したことを調べて みた。私がここで言っているのは、ネイマン博士の信頼限界のことだ。このr信頼」が「信 用詐欺」でないとは、とても確信できない。
そうー;ーー[-1ってから"ボゥリーはネイマンの信頼区間の例題を計算すると、こう言葉を続けた。
本当にこれは新しい発見なのだろうか。トッドハンター(Todhunter:一九世紀終わりの 確率論学者)が知っていた以上のことをわれわれが知っているのだろうか。われわれはヵー ル.ピアソンやエッジヮース(Edgeworth :数理統副学初期の先駆者)を越えているのだろ うか。これは、われわれが必要とすることー.?サンプリングにおける母集団に対して、その
信頼区間が'疋の範囲内に収まる可能性??を示してくれるのだろうか。そうではないのだ ろうか、いや、私は自分の考えを適切に表現できているかどうかさえも、よくわからない。 しかし、この方法が初めて示されたときから、どうも問題があるように思えてならない。こ の理論の展開は説得力がないので、自分が納得できるまで信頼区間の妥当性を疑わざるを得 ない。
この手法に対するボゥリーの問題提起は、以降、信頼区間のアイデアを悩ませることになった。 明らかにネイマンが自らの方法を導くのに使った四行にわたる鮮やかな計算は、確率論における 抽象的な数学理論としては正しいものだったし、それはある確率を算出した。しかし、その確率 が何を意味するのかははっきりしなかった。データが観測され、母数は(未知であっても)固定 された数だから、母数がある特定の値をとる確率は、母数がその特定値そのものであれば一〇 〇%、そうでないならばゼロ%の、どちらかしかない。だが、九五%信頼区間は九五%の確率を 扱う。それはいったい何の確率なのか。
ネイマンは自らが提案したものを信頼区間と呼び、「確率」という言葉を使わないことでこの 問題をうまく回避した。ボゥリーや周りの人々は、この見え透いた企てをあっさりと見抜いたの である。
フイッシャjは討論者の一人だったが、この点を見過ごした。彼の議論は、ネイマンの論文と はまつたく関係のない、まとまりがなく漫然としたものだつた。というのも、フイッシャーは信
頼区間の計算にとても狼狽していたからである。フイッシャーはコメントのなかで、「推測確率 (fiducial probability)」というネイマンの論文にないフレーズに触れた。彼はまさにこの問題 ??母数の'区間推定に伴う不確実性の度合いをどのように決定するか??に長いこと苦しんでい たのである。
フイッシャーは尤度関数に関連した複雑でわかりにくい観点からこの問題に取り粗んでいた。 さつさと自分で証明したように、この公式を検証してみると確率分布の定義を満たしていなかっ た。彼はこの関数を「推測分亦」と呼んだが、本来の確率分布に適用される数学理論と同じもの を使うことが彼の洞察力を妨げる羽目になった。フイッシャIが望んだことは、観測データがあ るにもかかわらず、推測分布が母数に対する合理的な一組の値となることであった。
これはネイマンがつくったものとまったく変わらなかった"特に母数が正規分布の平均である とき、両者の方法から導き出される答えは同じだつたのである。このことからフイッシャーは、 ネイマンが自分の推測分布のアイデアを盗んで違う名前をつけたと思った"フイッシャーは推測 分布の概念を発展させることができなかった"この方法では標準偏差のようなもっと込み入った 母数を扱えなかったのである。
それに対してネイマンの方法は、どんなタイプの母数でも取り扱い可能だった。フイッシャー は、この両者のアプローチの違いをまったく理解していなかったようだ。亡くなるまで、ネイマ ンの信頼区間は自分の椎測E間の一般化にすぎないと主張しつづけた。自分の推測区間がそうで あつたように、ネイマンのさしあたりの一般化もかなり複雑な問題に直面すれば使えなくなるに
違いないと確信していたのである。
確率対信頼水準
ネイマンの方法は、どんなに複雑な問題にも対応できた。それが統計解析で広く使われている 一つの理由である。ネイマンの信頼区間における本当の問題は、フイッシャーが見込んだような 問題ではなかった"それはボゥリーが討論の始めにもたらしたものだったのである。この信頼区 間における確率は何を意味しているのだろうか。
ネイマンは、実生活の確率における頻度論的定義に頼ることで答えを得た。彼がその場で述べ」 また信頼区間に関する後年の論文でさらに明確にしたように、信頼区間はそのときそのときの結 論ではなく、一つの時間的な過程と見なすべきものなのである。長期間の試行で、統計学者が九 五%信頼区間を毎回計算していけば、母数の真値がその信頼区間のなかにおさまる割合がその試 行の九五%であることに気づく。ネイマンにとって、信頼区間に伴う確率は、それが正しい確率 ではなかった。結局、彼の方法を使う統計学者が長期間の試行を行うとき、正しく記述される頻 度だったのである。だから、今ここにある推定量がどれだけ「正しい」かについては何も語って ぃなぃ。
ネイマンがその概念を注意深く定義したように、またボゥリーのような統計学者が確率の概念 をごまかさないようにすればするほど、科学分野での信頼区間の一般的な使い方が、ますますず
さんな考えを引き起こしてしまう。
たとえば、九五%信頼区間の使用者が、母数は「九五%の確からしさ」でその区間におさまる と述べることは少なくない。第13章でジミー.サヴェッジとブルーノ.デ.フイネッティ (Bruno de Fines)に触れ、個人確率(これはこのような表現を正当化する)に関する彼らの研 究を紹介しよう。しかし、個人があることを確実だと思う度合いの計算は、信頼区間の計算とは 異なる。統計学の文献では、サヴェッジやデ-フィネッティの方法から得られた母数の区間が、 同じデータから得られたネイマンの信頼医間とは著しく異なっていることを示す論文は数多くあ る。
こゝっいった確率の意味に関する疑問にもかかわらず、ネイマンの信頼区間は、区間推定値を計 算する標準的な方法になっており、たいていの科学者は九〇%から九五%の信頼区間を計算し、 まるで母数の真値がその区間に含まれることを確信しているかのようである。
今日、誰一人として「推測分布」に触れない。その考えはフィッシャjとともに死んだのであ る。フィッシャーはそのアイデアを活かしたい一心で、非常に多くの巧妙で重要な研究を行った。 そのうちのいくつかの研究が本流となる一方で、やり残したままの研究もある。
この研究を通じて、フィッシャーは、自ら「逆確率」と呼ぶ統計の:分野に非常に近づくこと もときにはあったが、すぐに離れて行つた。逆確率のアイデアはレバレンド-トーマス■ベイズ (Reverend Thomas Bayes二八世紀のアマチュア数学者)により始まった。
ベイズはその時代の著名な科学者と連絡をとっては、複雑な数学の問題をよく持ちかけた。あ
る日、確率の標準的で数学的な定式をいじっていたとき、簡単な論理でそれら一:つを結びつける、 ぞっとするようなあることを発見した。
次章でペィズの異説に焦点をあて、なぜフィッシャーが逆確率を利用しようとしなかったのか を見ていくことにしよう。
ヴエネチア共和国は八世紀から一八世紀初頭にかけて、地中海における主要国の一つであった。 その統治は最も大きいときで、アドリア海沿岸からクレタ島やキプロス島にまで及び、東洋から ョーロッバへの貿易を独占していた。共和国は一群の貴族で統括され、一種の民主体制を維持し ていた。
領土の名E..I::のトップはド?ジHと呼ばれる総督だった。六九七年に共和国が誕生してから一 七九七年にォーストリアに滅ぼされるまで、一五?人以上が歴代の総督となった"ある者は一年 にも満たずに、ある者は三四年もの長きにわたり在位した。時の総督が死ぬと、精巧な手順を踏 んで選挙を実施した。貴族の年長者のなかから、くじにょって数人がレクター〔p&lAliflluに 選ばれる」このレクターたちがさらなるメンハーを何人か選ぶ。これをもって選挙の第|段階と
した。このなかからまた少人数がくじにょつて選ばれる。これを何画かくり返して、最終段階ま で残ったレクターのなかから総督を選ぶのである。
共和国の歴史の初期には、レクターの選抜に多数の蝌ボールを用いた。そのなかには空のもの と「レクター」と書かれた紙片が入ったものがあった。一七世紀ごろには、金と銀の同じ大きさ のボールを使って最終段階まで進められた。一二六八年にラィニエリ.ゼーノ 0Rairderizeno) 総督が死んだときの選抜は、第二段階で三〇人のレクターがおり、三?個の蝌ボ?ルが用意され、 そのぅちの九個に紙片が入っていた。
小さな子供がボールの前に連れてこられた。その子供は籠からボールを一つ選び、それを一番 目のレクタjに手渡した。そのレクターはボールを開け、次の段階へ進めるかどぅかを兇た。そ の子供はまた一つボールを選び、二番目のレクターに手渡した。そのレクターはボールを開ける といつたょぅに、同じことがくり返された"
子供が最初のボールを選ぶ前、その三〇人のメンバーはみんな、三?分の九の確率で次の段階 に進むことができる。もし最初のボールが空であれば、残りのメンバ?はニ九分の九の確率で選 ばれることになる。もし最初のボールに紙片が入っていれば、残りのメンバーの確率はニ九分の 八になる。いったん二番目のボールが選ばれると、三番目の人がレク夕hに選ばれる確率は、一: 番@の結果次第で増えたり減ったりする。この抽選が全部で九個の紙片の入ったボールが選ばれ るまで続く。九個出つくした時点で残っているメンバーが次の段階のレクターに選ばれる確率は ゼロとなる。
これは条件つき確率の一つの例題である。あるメンバーが次の段階に進める確率は、それまで に選ばれたボールに依存している。ジョン■メイナード■ケインズは、すべての確率は条件つき であると指摘した。
ケインズの例題の一つに、書斎の棚からランダムに選ばれた本がバックラム(亜麻布)の装本 である確率は、書斎に実際ある本にもよるし、いかにrランダムに」選ぶかにもよる条件つき確 率である、とい、っものがある。
ある人が肺の小細胞がんに罹る確率は、タバコを吸った経験による条件つき確率になる。対照 実験において処置効果がないという帰無仮説を検定するのに計算されるP値は、実験計画次第で ある。条件つき確率の重要な点は、ある一定の事象の確率(たとえば、ある数字の組み合わせが くじで当たるなど)は事前条件が異なれば、違ってくるということなのだ。
一八世紀に発展した条件つき確率を扱う公式は、条件づける寧象が調べたい事象より前にすで に起こっているというアイデアに完全に依存していた。一八世紀後半に、あのレバレンド.トー マス-ベイズは条件つき確率の公式をいじっていて驚くべき発見をした。それはつまり、この公 式が内部対称になっていることだった。
二つの事象が時間を経て起こるとしよう。たとえば一組のトランプをよく混ぜて、ポ!力ーの 手持ち五枚を配る、などである。そのニつの事象を「事前」と「事後」と呼ぶ。「事前」で条件 づけられたr事後」の確率を考えるのは道理にかなっている。よく力ードが混ざっていないと、 手元にニ枚のエースがめぐってくる確率に影響を与えるかもしれない。しかしながらベイズは、
「事後」で条件づけられた「事前」の確率を計算できることを発見したのである。
これは道理にかなっていない。というのも、手持ち力ードのなかにニ枚のエースがあるという 前提を与えられたもとで、一組のトランプにエースが四枚ある確率をわざわざ決定するようなも のだからだ。もしくは、肺がんに罹ったもとでその患者が喫煙者であった確率、もしくは、チャ 1ルズ* A *スミスという人がくじに当たったところで、くじが公平に抽選されたかどうか、そ の確率を決定するようなものだ力らだ。
ベイズはこの計算過程を取っておいた。それは、ベイズが亡くなったとき、論文の山から発見 され、遺作として出版された。それ以来、ベイズの定理は統計解析の数学を悩ませている。道 理にかなっていないどころか、条件つき確率のベイズの反転はしばしば大きな意味を持つ。疫学 者がライ症候群〔m^^iiMし一のような珍しい疾患の原因を見つけだそうとするとき、たい ていはケ!ス?コントロール研究〔IIW--3を使う。そのような研究では、その疾患の患者(ケ hス)の1;群を集め、その病気に罹っていないがよく似た症状の患者(コントロール)の一群と 比較する。それから、コントロールの患者が発病したもとでの、事前の処置や条件の確率を計算 する。この方法によって初めて、喫煙が心臓病と肺がんにどれほどの影響を及ぼすかがわかった のである。サリドマイド催眠薬の使用が胎児に与える影響も、ケース?コントロール研究から導 かれた。
このように条件つき確率を反転させてベイズの定理をそのまま使う場合もあるが、より重要な のは、分布の母数を推定するためにこの定理を使う場合である',' ある分布の母数をそれ自体ラン
ダムなものとして扱い、それらの母数に関連した確率を計算したい衝動に駆られることがある。 たとえば、がんに対する処mAと処置丑を比較して、「九五%の確からしさで、処置八の五年後 の也存率は処置Bと比べて高い」と結論づけたいとしよう。この結論は、ベイズの定理を一、ニ 回適用することで得られる。
「逆確率」に関する疑問
長年このようなやり^でペイスの定理を使、っことはふさわしくないと考えられてきた。母数 に対して使われるときの確率は何を意味するのか、という深刻な疑問があったからだ。結局、ピ アソンによる統計革命で全体の基礎づけがなされたことで、科学における測定値そのものがもは や興味の対象ではなくなった。むしろピアソンが示したように、興味の対象はこれらの測定値の 確率分布であり、科学的調査のg的は、分布を定める(未知ではあるが固定された)母数の値を 推定することへと移った。もし母数がランダム(で、それは測定値で条件づけられる)と考えら れるならば、ピアソンのアプローチは明確な意味を持たなくなるだろう。
ニ?世紀の初頭、統計学者はその名のとおり「逆確率」に注意を払い、背を向けていた。王立 統計学会にフィッシャーの初期の論文が載る前の議論で、彼は逆確率を使ったことで責められ、 辛辣な非難に対して自分の立場を頑強に弁護した。またネイマンは信頼区間に関する最初の論文 で逆確率を使っているように見えたが、特?の計算をうまく避けるために数学的道具として使い-
一I番目の論文でベイズの{疋理を用いずに同じ結果へと達する方法を承した。一九六〇年代になる と、ベイズの定理を使ったアプローチの秘められた力と有用性に、多くの統計学者が引き寄せら れはじめ、ベイズの異説は徐々に認められるようになった。ニ?世紀の終わりには、統計学論集 C4ssas,0/&?<2?^??-5)誌やバイォメトリヵ誌などの学術雑誌に載る論文の半数が、べイズの方 法を使っているというほど容認されるに至った。しかし、ベイズの方法の適用は、特に医学分野 でまだ疑いをかけられることもある。
ベイズの異説を説明するのが難しいのは、数多くの異なるデ?タ解析法を持ち、加えてそれら 解析法の使用に対して少なくとも二つの異なる哲学的根拠があるためである。まったく違うアイ デアに同じ名称?!ベイジアン(Bayesian)??がつけられたようである。このべイズの異説の ニつの定式化、すなわち「ベイズの階層モデル」と「個人確率」について考えてみよ^-っ。
ベイズの階層モデル
一九七〇年代初め、フレデリック*モステラーとデイヴイッド?ゥォーラス(Davld^allace) によって文献解析の統計的手法が大きく発展した。アメリヵ合衆国憲法採択を支持して書かれた 論文集(Federalist papers)の著者をめぐる論争で両者が続計的手法を使ったことに端を発して
いる。
ー七八七年から八八年にかけて、ニユ.hョーク?がアメリヵ合衆1の新しい憲法を批准するよ
うに、とジ?^ス■マデイソン(James Madison)、アレキサンダ一.ハミルトン(Alexander Hamilton)とジョン*ジェイ(JQhnJay)は批准を支持するI連の論文を七?篇ほど*いた。そ の論文は匿名にされていた。一八〇〇年代初頭、ハミルトンとマデイソンは、どれが自分の書い た論文かを明らかにした。ところが両者ともに自分が書いたと主張する論文が一二篇もあったの である。
渦中の論文を統計解析するために、モステラーとゥォーラスは「内容」のない数百個の英単語 を調べた。それらは「if」「when」「because」「over」「whilst」ras」「and」のょうないくつかの 単語だった"これらの単語は文章に文法的な意味を与えるのに必要だが、それ自体に特別な意味 はなく、用途は主として著者の言い回し次第なのである。これらの意味のない単語数百個のなか から、二人の著者が他の著述で使った頻度の異なる三?単語をモステラーとゥォーラスは見つけ だした。
たとえば、マデイソンは「upon」という単語を 一O??単語あたり平均〇' ニー:一回使ったの に対して、ハミルトンは 一o〇〇単語当たり平均三.ニ四回使っていた(論争の一二論文のうち 一一篇にはまったく「upon」という単語がなく、残りの論文では、一〇〇〇単語^たり平均 i .一回使われている)。これらは、特定の一〇〇〇単語のなかでの平均頻度をいっているので はない。平均頻度はあくまで平均なので、一〇〇〇単語数えられた特定の箇所内でのその単語数 を意味しているわけではない。しかし、それらは二人の異なる人物にょって書かれた論文におい て、単語の出現分布における:つの母数の推定量となっている。
ある論文の原著者は誰かという疑問に対して、次のような言い方ができる。
「こ、っいった単語の使用バターンはマデイソンに関連した確率分布から、それともハミルトンに 関連した確率分布から来ているのか」
これらの分布は母数を持っているが、マデイソンとハミルトンの仕事を定義する特定の母数は 異なる。その母数も彼らの仕事から推定されるにすぎず、それら推定量が間違っているかもしれ ないのだ"問題の論文にどちらの分布が適用されうるかを判別する試みは、この手の不確実性を 伴わざるを得ない。
不確実性の程度を測るための一つの方法は、次のことに気づけるかどうかである。つまり、彼 らニ人のこれら母数の正確な値が、一八世紀後半の北アメリヵで英語の書法教育を受けたすべて の人々に対する母数を持つ分布から得られているということだ。たとえば「5'」について?てみ よう。ハミルトンは一〇〇〇単語当たり一:四回使い、マデイソンはl〇〇o単語当たりニ三回使 った。その他の同世代の著者たちは 一0〇〇単語当たりおおむねニニ回からニ五回使った。
その時代と場所で単語の一般的な使用量に関するパタjンを仮定すると、各人に対する母数は ランダムであるうえ、確率分^を持つことになる。このようにして、ハミルトンやマデイソンに よる意味を持たない単語の使用量を決める母数は、それ自体が母数を持つ。それは「超母数 (hypelpaxameter)」と呼ばれる。同じ時代と場所の他の著者による著作物を使って、超母数を推 定できる。
英語という一一a語は、場所や時代に応じて絶えず変化する。たとえば、二?世紀の英文学では、
「in」の使用頻度は一〇〇〇単語当たりH〇回も満たないが、ハミルトンやマデイソンの時代か らニ〇〇年経つと、使^量のパターンが少し変わっている。一八世紀の北アメリヵで母数の分布 を定義した超母数は、それ自体どんな時代でもどんな場所でも通/11する確率分布を持っていると 見なすことができる"一八世紀北アメリヵで書かれたものに、他の時代や場所で書かれたものを 加えることで、これらの超母数の母数を推定できる。これを「超超母数(hyperthyperparam- eter)」と呼ぶ。
ベイズの定理をくり返し使えば、母数の分布や超母数の分布までも決めることができる。原則 的には、この階層をさらに拡大して、起超超母数から超超母数の分布を決める、といったことも できなくはない。この場合、追加された階層での不確実性の生成に対して、明確な母数候補が見 皆たらない。超母数や超超母数の推定値を使うことでモステラーとゥォーラスは、「マデイソン (もしくはハミルトン)がこの論文を書いた」という記述に関する確率を測るのに成功した。
階層的ベイズ手法は、:九八〇年代初頭から工学や生物学の多くの難しい問題に適^されて成 功を収めている。その一つは、デ?夕がニつ以上の分布から得られているらしいという問題であ る。分析者は、観測データがどの分布から出てきたかを定義するょうな分布の観測されない変数 がある、と仮定する。この同定マ?力ーは母数だが、超母数を持つ確率分布に従い、それは尤度 方程式に組み入れることができる。レアードとゥェアのEMアルゴリズムは特に、この種の問題 に適している。
このょうなベイズ手法の広範囲にわたる使用は、統計学に混乱と論争とをもたらしている。と
いうのも、異なる結果を生じる異なる手法が提案されても、どちらか正しいのかを判断する基準 がないためである。伝統を重んじる者たちはー般にべイズ定理の使?に反対しているし、べイジ アン(ベイズの定理を使って解析する人)たちも自分らのモデルの0細な部分で同意していない。
こういった状況を打開するためにも、これらの議論を解決するような統一された原則を発見す る、フィッシャーのような天才の出現が求められている。しかしニー世紀に入った今でもそのよ うな天才は現れていない。この問題は、::::〇〇年以上も前にレバレンド.トーマス.ベイズにと ってもよくわからな力つたのと同じ状態のまま今に至るのである。
個人確率
もう一つのベイズのアフロ ーチは、もう少ししっかりとした板^を持っているように思われる。 これは個人確率(pe30nalprobability)という概念である。アイデア自体は、一七世紀のベルヌ イによる確率における初期の仕事に基づいている。実際、この確率という言葉は、個々人が持つ 不確実性を指すためにつくられたものだった。
ジミー.サヴHッジとブルーノ .デ.フィネッティは一九六?年代から七〇年代にかけて、個 人確率に潜む数学を一気に発展させた。一九六〇年代後半にノースヵロライナ大学で行われた統 計学の講義に出席した私は、サヴヱツジがこのようなアイデアを提起しているのを聞いた。この 世に証明された科学的事実などというものはない、とサヴヱッジは主張した。あるのは単に叙述
のかたちで、それに科学者を自称する人々が高い確率を与えたにすぎない。サヴェッジが言うに は、たとえばサヴェッジの講演を聞いているような人であれば「地球は丸い」という叙述に高い 確率を与えるだろう。しかし、世界中の人々を一斉に調査したら、中国の内陸にいる多くの農民 はこの叙述に、たぶん低い確率を与えるに違いない……。
ちようどそのとき、サヴェッジは話をやめなくてはならなかった。大学で学生たちが講堂の周 りを行進しながら「閉鎖しろ、ストライキだ、ストライキだ!閉鎖しろ!」と叫んだのだ。学 生たちは、ベトナム戦争に反対して、キャンパスで学生運動を呼びかけていた。彼らが通り過ぎ て喧騒がおさまると、サヴェッジは窓を見てこう言つた。「まぁ、知ってのとおり、われわれが、 地球が丸いと考える最後の世代になるかもしれないな」と。
個人確率には両極端な定義が存在する。一つの極端なものにサヴヱッジ=デ■フィネッティの アプローチがある。それは各人がおのおの固有の確率を持っているというものだ。そして、もう 一つの極端なものはケインズの考えによるものだ。ある文化圏で生まれ育った人であれば自ずと 考える信念の度合いを確率に置き換える。ケインズによれば、ある文化(サヴヱッジの言う「科 学者たち」や「中国の農民」)に属する人々がある叙述に対して持つ確率は、一般的なレべルで 一致しうる。確率のこのレベルはその文化や時代背景に左右されるので、確率としては適当なレ ベルであつても、ある絶対的な観念からすると、間違つていることは大いにありうるのだ。
サヴヱッジとデ■フィネッテイは、各個人が特有の確率を持つことを提案し、「基準的賭け」
という手法を用いてその確率をどのように引き出すかを述べた。一方、一定の確率を文化全体で
共有するために、ケインズは数学的{疋義を弱めざるを得なかった。そこでの確率は、六七%とい った明確な数字ではなく、考えを?序づける方法だった。たとえば、あした雨が降る確率は雪が 降る確率より高いといったものだ。
個人確率の概念がどれほど正確に定義されようとも、ベイズの定理による個人確率の方法は、 大平の人の考え方に適合しているように見える。ベイズ-アプローチは、ある人の考えによる事 前確率からスタートする。次に、その人が観測や実験を通じてデータを得る。そして、そのデー タが事前確率を修正するために使われ、事後確率を得るのである。
事前確率hデータh事後確率
その人がすべてのカラスは黒いか否かを確定したいとしよう。まずそれが正しいという確率に 関してある事前知識を持つところからスタートする。たとえば、最初カラスについてなんの知識 もないかもしれないので、すべてのカラスは黒いというのは五分五分の確率となる。次に、カラ スを観察してデー夕を得る。観察からカラスが黒いことがわかったので、事後確率は増える。次 にまたカラスを観察すると、新しい事前確率(古い宰後確率)は五〇%より大きくなり、さらに カラスを観察することでますます確率は大きくなり、最終的にすべてのカラスは黒いと確定する に至るのだ。
一方で、ある個人が非常に強い事前確率に支えられて作業を行うこともある。あまりにその事
前#.率に執着しすぎると、それをくつがえすのに膨.大なデータを必要とすることもある。
一九七九年、アメリヵのペンシルベニア州にあるスリーマイル島原子力発電所で、あわや大惨 事となりかねない事故が起きた。原子炉のオペレ;ターは操作パネルの前で原子炉の経過状態を 示す各種のメーターに目を走らせていた。それらは警告ランプだったが、一部が欠陥品だったた めにかつて誤作動したことがあった'」オペレーターはその事前信念から今回の警告ランプもまた 誤作動だろうと思いこんだ。警告ランプとそれにそれに伴う各種メーターが原子炉の冷却水が少 なくなったことを一貫して示しつづけたにもかかわらず、オペレーターは警告を無?しつづけた。 オペレーターの\前確率があまりに強すぎて、テ.hタによる事後確率がなかなか変わらなかった のである。
アメリヵ合衆国憲法採択を支持して書かれた論文集が、マデイソンによって書かれたものなの 73 ハミルトンによって書かれたものなの力という論争と同じく 二通りのうちどちらか一方 の可能性だけがあるとしよう。そうすると、ベイズの定理を適用することで、事前オッズと事後 才ッズとの簡単な関係を得ることができる。それはデータを集約したもので「ベイ、ス因子 (Bayes factor)」と呼ばれる。これは!種の数学的な計算であり、事前オッズとはまったく関係 なくデ?タを特徴づける。これを使うと、分析者は何でも好きな事前才ッズを決めたあとにベイ ズ因子を基けて、^後オッズを得ることができる。モステラーとゥオjラスはこれを.jニの論文 に対して行った。
二人はさらに、意味のない単語の度数解析にベイズによらないニつの手法を用いた。つまり、
物議を醸した論文の著者を決めるのに四つの手法を用いたのである。それは、階層的ベイズモデ ル、ベイズ因子、そしてニつのベイジアンでない手法だった。
結果はどぅなったか":::一篇の論文すベてで、圧倒的にマデイソンの手にょって書かれたもの だったといぅ結果が出た。実際、ベイズ因子を使って計算すると、論文のなかには、事後ォッズ を五o対五〇にもっていくのに事前才ッズを 一?万倍以上にしないことには、ハミルトンが 有利にならなかったものすらあったのである。
フイッシャーだけがニ〇世紀における統計手法の開発に貢献した最高の天才ではない。フイッ シャーより::::一歳若く、I九八七年に八五歳で亡くなったアンドレイ.ニコラエビッチ-コルモ ゴロフ(AndreiNikolaevichKoknogorov)は、フイッシャーの仕事の一部を土台にして、数学的 な深みと詳細さでフイッシャーをしのぐ数理統計学と確率論上の痕跡を残した。
しかし、コルモゴロフの科学への貢献ももちろん重要だが、この非凡なる彼が、出会った人た ちに与えた影響もそれに劣らず重要である。彼の弟子アルハ^?^ ? N .シリヤエフ(Albert N.shiryaev)は一九九一年に次のように記している。
コルモゴロフは、並外れて偉大で才能あふれる人という印象や、天才に出会ったような感
覚をもたらす選ばれし者の一人だった。コルモゴロフに関するすべてのことが尋常ではなか った。彼の人生、学生時代、そして数学、気象学、流体カ学、歴史、1語学、教育学にぉけ る先駆的発見の数々……。彼の興味は異常なほど多岐にわたり、音楽をはじめとして建築、 詩歌、旅行まで広がっていた。彼の博学ぶりにはただただ驚かされるばかりで、まるであら ゆることに対して、知識に裏づけられた意見を持つているかのょうだった。コルモゴロフと 会ったあと、軽く話をしたあと誰もが、彼は類まれな人物だと感じ、また常に頭をフル回転 させていると感じるのであつた。
コルモゴロフは一九OH年に生まれた。母親がクリミアから生まれ故郷の南口シアのツノシャ ナ村に向かう旅の途中でのことだった。だが母親はその出産で亡くなった。彼の伝記作家の一人 は上品にこう記述している。「彼は正式には結婚していない両親から生まれた男の子であった」
母親のマリア*ヤコフルフナ-コルモゴロファ(Mariya Yakovlevna Kolmogorova)は恋人に捨 てられ臨月をむ力えて故独に帰ろうとしていた。陣痛に耐えられなくなりタンボフの町で列 車を降りた彼女はその見知らぬ町で出産し、そこで独り、亡くなった。生まれてまもない息子だ けがツノシャナ村に帰ってきた。マリアの来婚の姉妹が彼を育てた。そのなかの一人、ヴェラ■ ヤコフルフナ(Vera \31;〇\40自&)が母.||代わりとなった。
叔母たちは、幼いアンドレィと彼の村の友だちのために小さな学校を始めた。「春のツバメ」 という名前の家族便りをつくり、彼の初の文学作品を載せた。五歳のとき、コルモゴロフは彼自
身初めての数学的発見をした(「春のツバメ」に掲載された)。始めのk個の奇数の和がkの二乗 に等しいことを見つけたのである。大きくなるにつれて、彼はクラスメィトに問題を出し、その 問題と解答を「春のツバメ」に載せるようになった。問題の一つはこうである。四つ穴ボタンを 縫いつけるのに何通りの縫い方ができるか。
一四歳になると、百科事典を使い、証明の抜けた部分を埋めながら高等数学を独学した。中等 学校では、彼が一連の永久運動機関の設計図をつくったときに若い物理教師にがっかりさせられ た"その設計図は実に巧妙につくられていて、コルモゴロフが注意深く隠した間違いにその教師 が気づかなかったのだ。コルモゴルフは一年早く中等学校の最終試験を受けることにした。その 決心を教師に告げると、昼体みが終わってから戻ってくるように言われたので、彼は散歩に出か けた。戻ってきてみると、試験委員会は彼に試験を受けさせることなく修了証書を与えた。コル モゴロフはシリヤエフに「この出来事は人生で最大級の尖望だった」と思い出話を語った。彼は、 難関にチヤレンジすることを楽しみにしていたのである"
一九二〇年' 一七歳のときにコルモゴロフは大学入学のためにモスクワに出てきた。数学科の 学生として入学したが、冶金学のような他の分野の講義にも出席し、ロシア史のセミナーにも参 加した。そのセミナーで彼は、のちに論文となった最初の研究の一部を発表した。その内.括は、
一五世紀から一六世紀にかけてのノブゴロド公国の領土に関するものだった。教授はその論文を 酷評した。というのも、証拠が十分ではないと考えたからだった。しかしあとになって、その領 土であった地域での考古学的調?から、コルモゴロフの推測が正しかったことが証明された。
モスクワ国立大学の学部生時代、彼は中等学校で非常勤教師として多くの課外活動にも参加し た。その後、モスクワで数学科の大学院に進学した。そこでは、必修科目が一四ほどあった。学 生は各利目の学期末試験を受けるか、独創的な論文を提,':!:1するかを求められた。何本もの論文を 書こうなどという学生はほとんどいなかつた。ところが、コルモゴロフはいっさい試験を受けな かった。:四の科目すべてにきわめて独創的な論文を用意したのである。後年、彼はこのことを 思い出して「一四の論文のうち一つだけ間違っていたのに気づいたんだ。でも、それはかなりあ とになつてからだけどね」と語つている。
コルモゴロフは優秀な数学者として、ドイツの学術雑誌に掲載された一連の論文や出版された 本を通じて、西側諸国の科学者に知られるようになった。一九三o年代には、ドイツとスカンジ ナビアで開かれたニ、ー:ーの数学会議にも参加を認められた。だが第ニ次大戦勃発後、スターリン によって鉄の力?テンが降ろされると彼の姿は消えてしまった。
一九三八年、コルモゴロフはある論文を発表した"その論文で定常確率過程をスムーズにした り子測したりするための基本定理を証明した(これについては本^^の後半で述べる0戦争の機 密事項に_する興味深いコメントがノーバート.ウイーナ190&£^_佳洋)から届いた。当 時ウイ?K1は、マサチユーセッツェ科大学で大戦中や大戦後の軍寧問題にコルモコロフの考え た手法を応用しようとしていた。これらウイーナーの研究結果は、アメリカの冷戦対応にとって きわめて重要だったので、最高機密になっていた。しかし、その研究の大元はコルモゴロフの初 期の論文から得られたものだと、ウイーナーは主張したのである。
一方、第二次大戦中、コルモゴロフはソビエトの戦争準備のための理論の応用を開発中だった。 彼の社交上の特徴である謙虚さから、その基本的なアイデアが、遺伝学研究で似たような手法を 使っていたフイッシャーから得られたものだと考えていたのである。
コルモゴロフ、その人
一九五三年にスターリンがこの世を去ると、怪しい鉄のヵーテンが昇がり始めた。コルモゴD フはふたたび人前に現れ、国際会議に参加したりロシアでの国際会議を主催したりした。今や数 学界で彼は広く知れわたるようになっていた。コルモゴロフは、熱心で親しみやすく寛.大でユー モラスな男であり、広汎な関心事と教えることへの愛情を持っていた。彼の?い知性は常に耳に することへと向けられていた。
私の手もとに一枚の写真がある。それは一九六三年にイギリスの統計学者デイヴイッド■ケン ドール(DavidKendau)から依頼されたトビリシでの講演で、聴衆のなかにいるコルモゴロフ の写真だ。メガネがずれ落ちて鼻先で止まり、議論に熱中するあまり前のめりになっている。写 真を見ればきっと、彼を囲うようにして座る聴衆の真ん中で' みなぎる彼の活気を感じることだ
ろう。
彼のお気に入りの活動に、モスクワの英才児を集めた学校で教えたり課外授業を開いたりする ことがあった。彼は子供たちに文学や音楽の手ほどきをするのが好きだった。子供たちをハイキ
ングや旅行にも連れていった。彼は、子供一人ひとりが「全人格を自由奔放に発達させるべき」 だと考えていた、とデイヴイツド-ケンドールは書いている。
「子供たちが数学者にならなくてもかまわなかった。たとえどんな職業に就こうとも、視野が広 く好奇心を失っていなければ、コルモゴロフは満足だったのだ」
コルモゴロフは一九四ニ年にアンナ.ドミトリエフナ.エゴロワ(Anna DmitrievnaMgorova) と結婚し、八?歳に至るまで愛情に満ちた結婚生活を送った。彼は暇があればハイキングやスキ 1にせっせと出かけた。七O代になると若い人たちに混じって好きな山々の小道を歩きなガら 数学、文学、音楽、そして人生について議論した。一九七一年には、調査船ドミトリ■メンデレ 1エフ号に乗り^み、科学的な海洋調査に加わった。.
同僚たちは、彼の尽きない興味や豊かな知識にいつも驚かされていた。ローマ教皇ョハネ.パ ゥロー一世cohnpaul)に謁見しときも"このスポーツ好きの教皇とスキーについて議論を交わ し、|九世紀のあいだ太った教皇と?せた教皇とが互い違いに即位したことやョハネ?パゥロニ 世が第二六四代の教皇であることを指摘した。彼の興味の一つに、ローマ-ヵトリック教会の歴 史があったようだ。また、ロシア詩人に関する統計的文献解析の講義をした際には、プーシキン (Pushkin)の詩の長い抜粋をそらで引用してみせた。
一九五三年には' 五?歳の誕生日パーティ?がモスクワ_立大学で開かれた。講演者の一人で 名誉教授のパーベル.アレキサンドロフ(PavelAleksandrov)はこう語っている。
コルモゴロフは、どんな分野の仕事も独りで行い、徹底的に再評価させてしまう数学者の 一人である。近年の数学者のなかで、これほど広汎な事柄に興味を示すだけでなく、これほ
ど数学に影響を与えている数学者を探すのは難しい。 ハーティー(Hardy一 卓越したィ
ギリスの数学者)は彼のことを三角級数の専門家だと思い、フォン,カルマン(vonKar- man:第二次大戦後のドィツの物理学者)は彼を力学の専門家だと思っていた。ゲーデル (Go:del:■数理哲学の理論家)はかつてこう言っている??「要するに天才とは' 若さの持 続性である」。若さはいくつもの特色を持っており、興奮もその一つである。数学における 興奮は、コルモゴロフという天才の一つの特?である"コルモゴロフの興奮は、自身の、創 意に富んだ研究、大ソビエト百科事典の記述、博士論文の拡張にある。ただしこれは、彼の 表の姿にすぎない。その裏にはひたむきな努力があるのだ。
彼のひたむきな努カの結果はいったい何だったのだろうか"数学、物理学、生物学、哲学の分 野において、コルモゴロフが足跡を残した領域を列挙するょりも、大きな影響を与えなかった領 域を列挙するほうがはるかにたやすいだろう。一九四一年、彼は乱流量に対する現代数学的アブ ローチを発見した。それから一九五四年には、惑星間の重力の相互作用を検証し、一〇〇年以上 も数学的解析を寄せつけなかった「非可積分(non-integrable)」な周面をモデル化する方法も発 見している。
数理統計学におけるコルモゴロフの研究
統計革命に関して、コルモゴロフは最も差し迫った理論的問題をニつ解決した。亡くなる前に は、統計的手法の核心をおびやかす一つの深遠な数理哲学的問題の解決に近づいていた"ニつの 差し迫つた問題とはこうだ。
1、確率の本当の数学的根拠は何か。
2地震(や地'-1'核実験)による地球の震動のような時間を経て集められたデ^^タをどのよう に処理すればいいのか。
コルモゴロフが一つめの問題にとりかかり始めたころ、確率は理論数学者のあいだでいささか 疑わしい目を叫けられていた。というのも、確率を導く数学的テクニックはすでに巧妙な計算 (たとえば、一組のトランプから五枚の力ードを三セット引いたとき、ただ一人だけが勝つ組み 合わせは何通りあるか)として一八世紀のうちに発達していたからである"こういつた巧妙な計 算方法は単一の基礎となる理論構造がないように思われた。それらはたいていその場限りで、特 定の必要性に合うようにつくられていた。
大半の人には問題を解くための手法さぇあれば事足りたのだろうが、ー九世紀終わりからニ0
世紀にかけての数学者には、それではすまされなかった。それらの解法に間違いがないと確信す るための強固で厳密な基礎理論が必要だったのだ。一八|1-紀の数学者が利?したようなその場限 りの手法は、それはそれで有効ではあったものの、間違って適用されると難しいバラドックスを 引き起こした。
こうした手法に対して、数学的に強固で嚴密な基礎を築くことが、ニ〇世紀初頭の数学では主 要な仕事と見なされた。アンリ*ルべーグの仕事が重要な主たる理由はこうした点にある(ルべ 1グはイHジー,ネイマンに数学で強烈なインパクトを与えたが、ネイマンはルべjグに会うと、 彼のことを不作法な田舎者だと思ったという、あのルべーグである0ルべーグは、積分計算の その場限りの手法にしっかりとした基礎づけをした。また、確率論も一七世紀から一八世紀に発 案された不完全な状態のままでは、ニo世紀の数学者にしてみれば直ハ価が劣ると見なすしかなか った(そうした見解には、統計的手法も含まれていた)。
コルモゴロフはこうした確率到算の本質について考えていくことで、寧象の確率を決めること が不確定なかたちの領域を決めることと同じだと気がついた。新たに登場してきた測度論の数学 を確率の計算に見合うように改変した。これを使い、小さな集合に関する公理を定義することで、 確率論の全体像を構築することができた。これがコルモゴロフの「確率論の公理化」である。今 日、これが確率を考えるうえでの唯!の方法と教えられている。これのおかげで確率の計算の妥 当性に関するどんな疑問にも答えられるのである。
一つめの確率論の問題を解決したあと、コルモゴロフは統計的手法の次の大きな問題にとりか
かった(むろんその間に、英才児たちを教え、セミナーを企画し、数学科の授業を持ち、力学や 天文学の問題を解き、そして心ゆくまで人生を楽しんだ)。統計的計算を可能にするため、フイ ッシャーやそのほかの統計学者たちは、すべてのデータは独立であると仮定していた。彼らは一 連の測定値をまるでサイコロを振って生じたかのように見なした。つまり、サイコロは前に出た ?を覚えていないから、新しく出た目は完全に以前のものとは無関係で独立していたのである。
ほとんどのデー夕は互いに独立ではない"『研究者のための統計的方法』でフイッシャーが使 った最初の例は、生まれたばかりの息子の週ごとの体重だった。明らかに、ある週でぐんと子供 の体重が増えたならば次の週の体重はその影響を受けるだろうし、また逆に、ある週に病気をし て体重が増えなかったならば次の週の体重はその影響を受けるだろう。実生活で時間を経て観測 し集められた一連のデ?タ列が、完全に独立していると考えるのは難しい。
「収量変動の研究」(これは膨大な量の論文で、ヒユー■スミス教授が私に紹介してくれたもの である)の三作目でフイッシャーは、何年間かにわたって測定された小麦収穫量と何日間かにわ たって測定された降水量を扱った。時間を経て集められたデータが独立でないという事実を説明 するために、一組の複雑な母数をつくってその問題に挑んだ"そして、信憑性の低い仮定を使っ てきわめて限られた範囲の解を得たのである。フイッシャーはそれ以上研究を進めることができ なかったし、その仕事を引き継ぐ者は誰もいなかった。
そう、コルモゴロフ以外は誰も。披はそれを引き継ぎ、以前の測定値に関連した測定値が長い 時間をかけて集められた一連の数値のことを「確率過程(stochastic process)」と呼んだ。彼の
先駆的な論文(第二次大戦が始まる直前に出版された)は、アメリカのノーバート.ウイーナ イギリスのジョージ-ボックス(GeorgeBOX)、そしてロシアのコルモゴロフの生徒らの将来の 研究を支える茶礎を築いた。
コルモゴロフのアイデアのおかげで今日では、時間を経て得られたデータを検証したり、高度 で明確な結論を得ることができるようになった。カリフォルニアの海岸に打ち寄せる波から、遠 くインド洋での嵐の位置を知ることができるし、電波望遠鏡は異なる電波信号発信源を判別でき る(たぶん、いつの日か地球外の知的生命体からのメッセージを受信するだろう)。地震計の波 形記録が地1核実験によるものなのか、自然地震によるものかを識別することもできる。エ学系 学術雑誌には、確率過程に関するコルモゴロフの研究を発展させた手法を利用した論文で溢れて いる。
実生活における確率とは何か
?年のコルモコロフはもっと難しレ問題 ^数学的というよりもむしろ哲学的な問題 に
取り組んだ"そして、その仕事を成し遂げることなく亡くなった"同時代の数学者たちは、彼の 洞察をどうやって掘り下げようかと考えをめぐらしてきた。本書の執筆時点でも、この問題はい まだ解決していない。本書の最終章で示すつもりだが、もしもこの問題が解かれることのないま まなら、科学に対するすべての統計的アプロ?チが、自らの矛盾に堪えきれずに崩壊するかもし
れない。
コルモゴロフの最終問題はこうだ。「確率は実生活においてどんな意味合いを持っているのか」。 彼は、満足のいく確率の数学理論を構築した。しかしこれは、確率論の定理と手法が内部的には まったく自己矛盾のないことを意味しているにすぎない。科学の統計モデルは' 単なる数学の領 域を飛び越えて、それらの定理が実生活の問題に適用される。そのため、コルモゴロフが確率論 で示したような柚象的な数学モデルを、実生活のある局面と結びつけて考える必要性が出てくる。 事実、このために、文字どおり数百の試みがなされてきた。だが、そのどれもが、実生活におけ る確率に異なった意味を与えているために批判も受けている。
この問題は非常に重要である。なぜなら、統計解析の数学的結論の解釈は、これらの公理をど のようにして実生活の状況に結びつけるかにかかっているからだ。
確率論におけるコルモゴロフの公理化で仮定しているのは、「事象」と呼ばれる基本的な事柄 の抽象的な空間が存在することである。この空間における事象の集合を、玄関テラスの面積や冷 蔵庫の容童を測るのと同じように測ることかできる。寧象の抽象空間上のこの測度がある種の公 理を満たすならば、それは一つの確率空間を成す。
実生活で確率論を使うためには、事象とこの空間とをI致させなくてはならないうえに、その 空間上で実際に確率測度を計算できるように十分に限定されていなければならない。実験科学者 が統計モデルを使って結果を解析するときのこの空間はいったい何なのか。ゥィリアム-シ!リ 1■ゴセットは、実験のすべての出力可能な集合でもってその空間を提案したが、どうやって確
率を計算すればいいのかについては示せなかった。コルモゴロフの抽象空間と一致させることが できない限り、統計解析から生じる確率記述は、さまざまな違いと、ときには正反対の意味を持 つことすらあるだろう。
たとえば、エイズの新しい治療法の効きめを調べるために臨床試験を行い、その統計解析から 従来の治療法とこの新式治療法との違いが有意であると示されたとしよう。このとき、医学界は 新たなエイズ患者に対して、新しい治療法が効果があると確信できるだろうか。その新しい治療 法はエイズ患者のある一定の割合に対して効果があるのだろうか。もしくは、この研究対象に選 ばれた患者#においてのみ、新しい治療法が有効であるように思われるのだろうか。.
実生活での確率の意味を兒つけるには、たいてい、コルモゴロフの抽象的な確率空間に対して 実生活における意味を提案するアプローチがとられてきた。ところが、コルモゴロフは別の方針 をとった。熱力学の第二法則、力ール-ピアソンの初期の研究、情報の数学的理論を兒つけよう としていたアメリカの数学者たちの試み、そして大数の法則におけるポール■レヴィの仕事など から多.くのアイデアをまとめることで、コルモコロフは一九六五年から始まる一連の論文を執筆 し、その数学的問題に対して過去の公理やら自らの答えやらを拭い去って、確率を扱おうとし た……。
一九八七年一〇月ニ〇Hにその生涯を閉じるまで、アンドレイ.ニコラエビッチ■コルモゴロ フは生気に溢れ' 独創的なアイデアを次々と生み出した。そして、誰一人として彼のやり残した 問題を扱うことができずにいる。
ソビエト統計学の失敗に関するその後
コルモゴロフとその弟子たちは、確率と統計の数学的理論に多.大なる貢献をしたが、ソビエト 連邦はその統計革命の恩恵をほとんどこぅむらなかった。このことは、政府がすべての問題に対 して「正しい」答えを知っているとき何が起こるのか、の.Iつの例を提供してくれる。
帝政ロシア皇帝が去りロシア苹命の始まるころ、ロシアでの統計学の研究は相1|/:-:な数にのぼっ ていた"nシアの数学者たちはイギリスやョ|ロッバ諸国で発表される研究にかなり目を光らせ ていた。ロシアの数学者や農業経済学者による論文はバイオメトリ力誌に掲載された。革命政府 は中央統計局を設立し、各ソビエト共和国にも似たよぅな統計局をつくった。中央統計局は統計 学研究の学術雑誌、ヴエストニク■スタテイステイキ(vesln^statis^M)誌を発行し、そのな かに英語やドイッ語の学術雑誌に掲載された論文の要約を載せた。一九二四年ごろには、ヴェス トニク-ス夕テイステイキ誌に農業研究への統計的計画法の適用に関する解説が載った"
一九三o年代、スターリンによる恐怖政治が始まると、正統派共産主義理論の魔の手がこれら の活動に襲いかかった。共産党の理論派たち(聖マルクスや聖レーニンによる宗教の神学者で、 たとえばチヱスタh-ブリスである。第8章を参^のこと)は梦計学を初会科学のー部門と見な していた。共産主義の教義によれば、すべての社会科学は中央計画に従属するものだった。確率 変数の数学的概念は統計手法の悩みのタネとなるもので、「確由十変数(自11^03<3!13^16)」は、ロ
シア語で「偶然の大きさ(accidentalmagnitude)」と訳される。
国家統計局の役人や共産党の理論派たちにとって、これは侮辱以外の何ものでもなかった。ソ 連におけるすべての工業的.社会的な活動は、マルクスとレーニンの理論に基づいて計画されて いたからだ'」そこでは偶然なんてものは起きるわけがないのである。偶然の大きさは、資本'王義 経済で見られるもので、ロシアには存在しないものなのだ。数理統計の応用はたちまちのうちに もみ消された。s . S .ツァルコヴィク≪.8.2?1<07^)は、一九五六年の王立統計学会誌に掲 載されたソビエト統計学の歴史再考でいくぶん慎重に、このことを述べている。
ここ数年で、nシア統計学の発展がいよいよ政治的問題として際立って目につくようにな ってきた。これにより、統計局の実際の活動から統計理論が徐々に使われなくなっていった。 一九三〇年代遅く、ヴェストニク*スタティスティキ誌は統計的問題を数学として取り扱う 論文を掲載しなくなり、三?年代終わりにはそういった論文は完全に姿を消し、以後まった く掲載されなくなった。このため統計学者は、大学や科学研究所でほかの教科の名前を偽っ てまで統計学の研究をしつづけようとはしなかった。公式には、コルモゴロフ、N ■ V ■ス ミルノフ(N.v.smirnov)、V ' I - ロマノフスキ一(V,1.Romancvsky)などの数学研究者が、 統計学と絶縁した。非常におもしろい例はE.スルツキー(E.slutsky)で、彼は計量経済 学の先駆者の一人として世界で広く名声を博していたが、統計学を諦めて、新しいキャリア を天文学に求めていった……。ソビエトの公式見解によれば、統計学は国家経済を計画する
ための道具であった。それは一つの社会科学、すなわち一つの階級科学を意味した。大数の 法則' 偏差の概念、そして統計学の数学的理論に属するその他すベてのものが、統計的科学 における誤った一般的理論の構成要素と見なされ、廃止されたのである。
政府のこうした考え方は統計学にとどまらなかった。スターリンは、大法螺吹きの生物学者ト ロフィム.〇‘ルィセンコ^3&110.1^6111;0)を重用した。ルィセンコは、遺伝学理論を否定 し、動植物がその特性を遺伝的に受け継ぐのではなく、生息環境によって形づくられると主張し た。遺伝学の数理的研究でフィッシャーに追随しようとする生物学者は、研究を邪魔されたり、 刑務所に送られたりした。
正統だと認められた理論がソビエト統計学に及ぶにつれて、中央統計局とその支部でつくられ た数字はだんだん疑わしいものになっていった。中央統計局の計画のせいで、ゥクラィナとベラ ルーシの肥沃な農地は泥だらけの荒地になった。動きそうもない貧弱な組立て機械とできそこな いの消費財が大量にロシアの工場から吐き出された。ソ連は国民に食料を供給できず深刻な問題 を抱えていた。機能した唯一の経済活動は闇市場だった。それでも中央政府は楽観的で事実と異 なる統計値を報告し、実際の経済活動の水準を、その変化率や変化率の変化率を扱う報告書を作 成することで隠蔽した。
一方でノ _ハ 广?ヴィ?ナーのようなアメリカの数学者らはコルモコロフやアレキサンド
ル■ヤ,ヒンチン(AlexanderYa.Khintchine)の確率過程に関する定理を使ってアメリカの戦
争準備に役1/;て、またゥォルタh.シユーハート(Walter shewhart)とアメリカ連封標準局の 役人は、アメリカ産業がいかに品質.管理の統計手法を使っているかを示し、さらにはアメリカ、
ョーロッパ、一部のアジアで農場の農業生産高がとんとん拍子に増加しているというのに、かた やソビエトでは工場は役に立たない機械を出荷しつづけ、農場は国民を養うだけの作物を生産で きなかったのである。
一九五〇年代にニキータ■フルシチョフ(Nikita Khrushchev)が政権をとって、ょうやくこ の1|家計画理論の魔の手が取り除かれ始め、統計手法が試験的に:1:場や農場に適用されるょうに なった。公的な「統計値」は相変わらず嘘と巧妙な操作で溢れていたが、応用統計を扱った学術 雑誌の出版に向けての努力が実り、不{疋期ながらニ、三の雑誌を出版するまでに漕ぎつけた。現 代統計モデルのロシア産業への拡大は、一九九O年代終わりのソ連とその国家計画システムの完 全な崩壊まで待たねばならなかった。
ひょっとすると、このことから学ぶ教訓があるかもしれない。
フローレンス.ナイチンゲール(FlcrenceNightingale)は、イギリスのヴィクトリア時代の伝 説的な人物だが、彼女と顔を合わせる国会議員やイギリス軍の将官たちは彼女を恐れていた。彼 女のことを単に看護師の祖、優しく献身的な慈愛に満ちた人物のょぅに見なしがちだが、現実の フローレンス.ナイチンゲールは使命を持った女性だった。また、独力で学んだ統計学者でもあ
った。
ナイチンゲールの使命の一つは、イギリス軍に野戰病院を維持させ、戦場での兵士に対する看 護や医療を提供させることだった。自らの意£を支えるために、彼女は軍のファイルから出た人 量のデータと悪戦苦闘して、王立調査委員会の前に驚くべき一連のグラフを提示した。そのなか で、クリミア戦争でのイギリス軍死者の多.くが、戦場ではなく病気に感染して命を落としており、
それは負傷兵を適切な処蜃をしないまま長らく放置したためであることを明らかにした。この事 実を示すためにバイチャート(円グラフ)を発明したのである。
鈍感で無知に思える将軍らとの戦いにうんざりすると、彼女はアイヴァントンの村へよく帰っ たものだつた。そこでは友だちのデイヴイツド一家にいつも歓迎されていた。そこの若いデイヴ イツド夫婦に娘ができたとき、その子にフローレンス■ナイチンゲール.デイヴイツド (FcrenceNightingaleDavld)と名づけた。フローレンス.ナイチンゲjルの威勢のよさと開拓 精神のいくつかは、どうやらその娘に受け継がれたようだ。
F . N .デイヴイツド(この名前で本を一〇冊出版し、科学学術雑誌に:o〇本以上の論文を 発表した。以下、このように記す)は一九o九年に生まれ、五歳のときに第一次大戦が始まった ため、普通の教育課程を歩むことができなかった。デイヴイツドー家は小さな田舎の村に住んで いたので、彼女の最初の学校教育は地元の牧師による個人授業であった"その牧師の学習方法は 一風変わっていた。彼女がすでに算数を習得したと気づくと代数を教え、すでに英語も習得した と思うとラテン語とギリシャ語を教えたのである。lo歳になると、彼女は正式な学校に通い始 めた。
大学に進学するころになると彼女がユニハーシテイ.カレツシ* ロンドンに入学したレと知 つた母親は肝を潰した。ユニバーシテイ*カレツジはジェレミー■ベンサム (Jeremy Bentham :彼のミイラとなった身体はヵレッジの回廊に正装して座っている)によって創設され、 「手に負えぬ者、異端者、そしてイギリス国教会三九信仰箇条^1l,i一^以1|,|〕を公言してい
ユニバーシティ.カレッジ.ロンドンに安置されている 哲学者ジェレミー?ペンサムの遺体
ないような人」のために設立された。ユニバーシテイ-カレッジができるまでは、イギリス国教 会の三九箇条を公言した人だけが、イギリスの火学で教鞭をとったり学んだりすることが許され ていたのである。
デイヴイッドが大学進学の準備をしていたときでさえ、ユニバーシテイ■カレッジは非国教徒 の温床だとのうわさがまだあった。「母は、私がロンドンに行く間際までかんかんに怒っていた のよ……不名誉で横しまだし、とにかくいやで」。そこで、彼女はベッドフォード-カレッジ- ロ ンドンに進学した。
「そこがあまり好きではなかったわ」。かなりあとになってからのことではあるが、ハーバード 大学公衆衛生学部のナン■レアードとの会話記録のなかで彼女はそう語っている。「本当に好き だったのは毎?劇場に行くことだったの。学生なら六ペンスも払えばオ?ルドビックに行けたの よ。……よいときを過ごしたわ」。彼女は続けた。「大学での三年間、数学だけを勉強したけれど、 それはあまり好きではなかった。数学者も好きじゃなかったし、肖時、私は反抗的だったと思う。 でも、そのことを浅はかに振り返ったりはしないわ」。
彼女が卒業した時代の数学を使ってどんな仕事に就くことができただろ.うか。彼女は 保険計理人になりたかったのだが、どこの保険計理人会社も男性しか雇わなかった。誰かのアド バイスで、彼女はユニバーシテイ■カレッジのフH 口ーだった力ール.ピアソンに会いにいくよ うに勧められた。その人はピアソンが保険計理人みたいなことをしていると聞いていたのだ。デ イヴイッドは歩いてユニバーシテイ■カレッジに行き、「力ール.ピアソンに会って自分の計画
が潰れてしまつたのよ」"ピアソンは彼女を気に入り、さつそく研究生として研究をしていくた めの奨学金を彼女に与えたのである。
力ール.ピアソンのもとで働きながら
力ール■ピアソンのところで働きながら、F* N .デイヴイッドは相関係数の分亦を求める際 の、複雑で難しい多重積分の解を計算する仕事に携わった。この仕事のおかげで彼女の初の著書 『相関係数表(7^£65〇/^0〇〇77.£.<2??.〇?2〇〇^^5.2?1)』が生み出され、ー九三八年についに出版 された。彼女はこれらすベての計算を数年にわたつてしたが、計算には「ブルンスヴイガ (Brunsviga)」として知られた手動式機械計算機を使った。
「ざつと::;〇〇万回ほどブルンスヴイガのクランクをまわしたかしら……(機械が壊れないよぅ に)長い編み針を巧みに使えるよぅになるまでは、いつも機械を詰まらせていたわ。機械が詰ま ると教授に知らせにいくんだけど、教授はこちらが想像したとおりのことを言ぅわけよ。『それ は大変困つたね』つて。だから、機械が詰まると、たいてい教授に言わずにさつさと家に帰つた ゎ」
デイヴイッドはピアソンを敬服し、彼の?年には多くの時間を彼とともに研究をして過ごした が、一九三〇年代初めには彼女はピアソンのことを恐れていたのである。
そぅかと思えば、彼女はまた向こぅ見ずな性格の持ち、-|--;で、クロスカントリー.レースに出場
してオ'?ト、ハイによく乗った。
あるH、ものすごい勢いで、高さ一六フイートの壁にぶつかって、壁の上部がガラスにな っていたんだけど、そこへ突っ込んでひざを怪我してしまったの。仕事に出ても私は見る影 もなかったわ"そこに(ゥイリアム■)ゴセットがやってきて、こう言ったの。「そうだね、 フライ.フイッシングでも始めたらどうだい」。彼はフライ-フイッシングの熱心な愛好家 だったのよ。そして私を家に招待してくれた。ヘンデンにある彼の自宅には、ゴセット夫妻 とその子供たちがいたわ。彼は毛ばりの投げ方を教えてくれて、とても親切だった。
デイヴイッドがユニバーシテイ*カレッジにいたそのころ、ネイマンと若いエゴン■ピアソン はフイッシャーの尤度関数を研究し始めて、年老いた力ール.ピアソンの怒りを買っていた。力 1ルはフイッシャーの尤度関数をまったくのナンセンスであると考えていたからだ。エゴンは父 親が主宰するバイオメトリ力誌にこのような論文を投稿して、父親をさらに怒らせるのを恐れて、 ネイマンとともに新しい学術雑誌^〇^&^-£.^656〇7^>?07§3.&5をつくり、ニ年にわたって発 行した(デイヴイッドの論文もいくつかそこに掲載された)。
力ール.ピアソンが引退し、息子のエゴンがバイオメトリ力誌の編集を引き継ぐとMemories 誌の発行をやめた。「親父」(カール■ピアソンはそう呼ばれていた)が息子とフイッシャーとに よってその地位を奪われたとき、デイヴイッドはまさにその現場にいたのである。若いイェジ
イェジー‘ネイマンと彼の二人の==レディ5たちaイーヴリン.フィックス (左)とフローレンス.ナイチンゲール‘デイヴィッド(右)。
h?ネイマンが統計学の研究をちようど始めようとしていたときも、彼女はそこにいた。「一九 ニo年代から四〇年代にかけての時代は、本当に統計学の揺籃期だったと思うの。私はそんな主 導者たちを下から見上げているようなものだった」と彼女は言った。
デイヴイッドは力ール.ピアソンをすばらしい講師と考えていた。「彼は上手に教えてくれた から、そこに座れば、内容が頭に沁み込んでくるのよ」。彼はまた学生による中断にも寛大で、 誰かが間違いを指摘すれば即座に修正するくらいであった。
一方、フイッシャーの講義は「とてもひどいものだった。まったく理解できないのよ。質問を してもそれに答えてくれなかった。私が女性だから」。そこで彼女はアメリカから来た男子学生 の隣に座り、彼の腕を押して「フイッシャーに聞いてよ、聞いて!」と言った。「フイッシャー の講義のあと、私は図書館で一U時間あまり過ごして、彼の言わんとすることを理解しようとした ものよ」。
カール.ピアソンが一九三三年に引退したときには、デイヴイッドは彼の唯一の研究助手とし てともに?yを送った。彼女は次のように記している"
力ール,ピアソンは超人並みであった。彼は七〇代だったが、大学でI日中何かしら働き つづけ、毎日六時に帰宅する。あるとき、彼と私が家路につこうとしたとき、彼が私に「そ うだ、今夜のうちに楕円積分をちよっと調べておいてくれないか。明日使いたいから」と言 った。私は、これから恋人とチエルシー ?アーッ.ポールに出かけるなんて'3えるほど神経
がM太くなかった。だから、とりあえずアーツ■ボールに行き、明け方の四時か五時に帰宅 すると風呂に入り、大学に向かった。そして彼が現れる九時前に約束の作業を仕上げた。若 気の至りであった。
力ール.ピアソンが亡くなる数力月前、デイヴイッドは生物測定研究所に戻り、イヱジー■ネ イマンと一緒に働いた。ネイマンは彼女が博士号を持っていないことに驚いた。彼の熱心な勧め にょり、彼女は直近に出した四つの論文をまとめて博士論文として提出した。博士号をとったこ とで何か変わったのか、と聞かれた彼女は、「ぜんぜん。ニ〇ポンドの手数料を払っただけだっ たわ」と答えた。
その当時を彼女はこう振り返っている。「ネイマンを静かな環境におくために私がここに来た んだと考えたかった。しかし実際には、騒々しい時間が過ぎた"というのも、フイッシャIはニ 階で大騒ぎするし、そのかたわらにネイマン、もう片方には力ール■ピアソンがいて、一週間お きにゴセットもやつて来たからである」。
彼女の回想は実に遠慮がちである。彼女はrネイマンを静かな環境におくために来た」下仕え どころではなかった。彼女は論文を発表し(そのなかの一つ、ニ〇?紀初頭のロシアの数学者 A ■ A -マルコフにょる独創的な定理を一般化したネイマンとの共著論文はきわめて重要であ る)、多くの分野で統計学の実践と理論とを進^させた"私の本棚にある統計的理論の各領域に 関する本を取り出してみると、その参考文献には必ずと言っていいほどF - N -デイヴイッドの
名前があるぐらいである。
%時労働
一九三九年に第二次大戦が勃発したとき、彼女はイギリス防衛省で働きながら、ロンドンのょ うな人口の密集した都市に爆弾が落とされたときの被害を予測しょうとしていた。負傷者の数、 電気、水道、下水などのシステムへの爆撃の影響、そのほかの被害想定の推定値が、彼女のつく った統計モデルから決定された。その結果、イギリスは一九四〇年と四一年のドイツ空軍のロン ドン大空襲に備えることができ、人命を救いながら生活に不可欠な公共サービスを維持できたの である。
終戦間際には彼女はこう記している"
私はアメリカの爆撃機に乗ってアンドリユー空軍基地に行った。彼らがつくったという初
の大型デジタル*コンピユータを見るためだ。 それはまるで、かまぼこ?組立て兵舎
〔^か^.錢1-^'1|!1れ^で、長さはー〇0ヤードほどあった。中央に向かってたくさんの 踏み板があり、それは木製のビット操作板になっていた。どちらの長さも:::、三フイート 〔llA-OA-^な1の畏さでニつの点滅するモンスタ!のH玉みたいなものがあった。天井はフユ 1ズだらけだった。W:?秒くらいのぺースで、兵士が上を見上げながらその踏板を踏み込ん
でフユ?ズを一つ押し込めていた。 帰ってきてからそのことを誰かに話すと……こう!?
われた。「椅子に座ってその言語を勉強したらどう?」。そこで私は、「とんでもないー.も しそんなことをしたら、私の残りの人生すべてをそれに費やしてしまうわ。私はやらない .^^誰かできる人がすればいいのよー.」と言い返した。
エゴン‘ピアソンは父親と違って威張り散らす人ではなかったので、生物測定学科内の他のメ ンバーのあいだで学科長を持ち回りにするという、新しい制度を導入した。デイヴイッドに学科 長が回ってきたとき、彼女は統計学の古典的一冊となった『組み合わせチャンス(oomg:sas- 3.ac%cmce)』の執筆にとりかかっていた。この本は組み合わせ論で知られる複雑な数え方の? 法を実に明快に解説している。
非常に複雑なアイデアが理解しやすいように一つの基礎的アプロ?チで提示されているこの本 について質問されたとき、彼女はこう答えた。
この仕事を始めたとたん、ぞっとするほどいやになってうんざりしたわ。組み合わせ論の アイデアを持つてから長いことそれにりつきりになつていたころD.E■ハ^~.卜'ン (D.E.Barton :彼女の本の共著者で、のちにユニバーシティ-ヵレッジの計算機科学の教授) と出会ったの。もっと前に出会っていたら彼に教えたのに"……でも、いよいよこの仕事を 完成させようというときだったから、彼を仲間に入れたの。彼は極限をとるといった類の難
しい仕亊をこなしてくれたわ。本当にいい人だった。私たちは実に多くの論文を一緒に書い
たゎ。
彼女はやがてアメリカのカリフォルニア大学パークレー校の学部に移り、ネィマンのあとを継 いで学部長に就任した。一九七o年にはパークレー校を去り、カリフォルニア大学リバーサィド 校で統計学部を創設し、その学部長になった。一九七七年に六八歳で「引退」すると、バークレ 1校の生物統計学部の活動的な名誉教授かつ研究員になった。この章で何度も引用した彼女のィ ンタビユーは、一九八八年に行われたものである。彼女は一九九五年に亡くなった。
ー九六ニ年、F.N■ディヴィッドは著書『ゲーム、神々、賭け事(Games,GO?an¢i Gamsisso』を出版した。そのときのいきさつを彼女はこう語っている。
若いころギリシャ語を学んだの。……砂漠のある場所を掘っている考古学の同僚がいたか ら考古学に興味が湧いたの、それでだと思うわ。とにかく、彼が私のところにきてこう言っ た。「砂漠のなかを歩き回って、これらの破片がどこで見つかったかをプロットしたんだ。 どこを掘れば貝塚が出てくるか教えてくれょ」って。
考古学者なんて金や銀なんかには口もくれず、壷や皿にしか興味がないわけ。それで、彼 から地図を受け取ってその問題について考えてみたの。そうしたら、これがまったく>>爆撃 機の問題にそっくりなのに気づいたのょ。ここがロンドンだと仮定して、ここに爆弾が落ち
たとするでしょぅ。どこからその爆弾が飛んできたのかを知りたければ、二次元正規分布平 面を仮定して主軸を予測できるわけ。それを破片地図に当てはめてみたのょ。異なる問題の あいだに一種の普遍性があるなんておもしろいと思わない?実際と違っていたのは、たっ たの六個ほどだったわ。
そぅやつて、フロ.^レンス.ナイチンケール.デイヴイッドは、さまざまな研究に"献したの である。
一九四o年代にアメリカン■シアナミド社で働いていた化学者のフランク■ウィルnクソン (Frank wucoxon)は、ある統剴的問題に悩まされていた。彼は、異なる処置の効果を比較する 仮説検定として、「ステユーデント」のt検定やフィッシャーの分散分析をしていた。これらは 当時、実験データを解析する標準的な手法だった。統計革命が科学分野全体に及んで、これらの 仮説検定を解釈するための表などを集めた書籍がどの研究者の本棚にも置かれていた。しかしウ ィルnクソンは、これらの手法がたびたびぅまくいかないことに頭を痛めていた。
彼は、明らかに処置の効果が異なるょぅな一連の実験を行った。そのセ検{疋をすると、有意に なったりならなかったりした。化学工学での実験では、反応装置(化学反応が起きる場所)が実 験試行の初期段階で十分に温まっていないことがょくある。すると特定の酵素の活性が変化する
第?章母数を取リ除く
ようなことが起こるかもしれない。その結果、実験値が間違っているかのように思えてしまう。 また、その数値はしばしば極端に大きかったり小さかったりする。この外れた結果の原因を同定 できるときもあれば、結果自体が外れ値(極端に異常な値)で、他のすべての結果と大きく異な っても、理由がはっきりしないときもある。
ゥイルnクソンは、t検定と分散分析の計算公式を調べて、これらの外れ値が結果にかなりの 影響を与えているため「ステユーデント」のt検定が通常より小さな値をとることを突き止め た(一般的に、t検定統計量の大きな値は小さなP値を導く}。
そこで観?テータから外れ値を除き、残りのテータでt検定を計算してみることにした。こ の試みが' 仮説検定の数学的な導出に対していくつかの問題を投げかけることになった。その数 値が本当に外れ値であると化学者はどうやってわかるのだろうか。いくつ外れ値を除かなければ ならないのか"もしも外れ値が除かれたとして、化学者は標準的な検定統計量の確率表を使いつ づけることができるのだろうか。
ゥイルコクソンは過去の論文をあさった。その統計的手法を開発した偉大な数学の大家たちは、 この問題をわかっていたに違いないのだ!だが、参考文献を見つけることはできなかった。そ こで、この問題を同避する方法を見つけようと考えた。その作業は観測値の組み合わせや順列に 基づいて、ただひたすら計算をするという退屈なものだった(F ? N .デイヴイッドの組み合わ せ論は前章で述べた)。こうして彼は、組み合わせによる値を計算するための手法を研究し始め たのである。
ああ、それにしてもこの作業はばかばかしい!なぜウイルnクソンのような化学者が、こん な簡単ではあるが退屈きわまりない計算をしなくてはならないのだろう。統計学者の誰かがきっ とこんなことはすでにやっているに違いないのに!彼は統計学の文献を調べ直してこのような 論文を探した。しかし、そのような論文は見つからなかった"そこで彼は自分の計算手法が正し いことを確かめるために、論文をBiometrics誌(ピアソンの'ハイオメトリ力誌と紛らわしいが) に投稿した。それでも彼は、自分の研究がオリジナルではないと信じており、レフヱリーが発表 済みのその問題に関する論文を知っていて、自分の論文を却下するだろうと決めてかかっていた。 拒否されればそれらの文献を知ること力できるだろうと思つていたのだ。ところがレフエ リーと編集者の判断によれば、この論文はオリジナルなものだった。誰も以前にこんな問題を考 えておらず、彼の論文は一九四五年に発表された。
ウイルコクソンも安0義^3.015誌の編集者も知らないところで、経済学者のへンリh-!^-マ ン(Henry B.Marm)とオハイオ州立大学統計学部の大学院生であったD -ランサム■ホイット ニー(D.Ransom Whitney)がそれに閧連した問題に取り組んでいた。二人は、一九四o年と四 四年の賃金分布を比較して、ある意味で一九四〇年のほうが低いといえるような統計的分布の順 序づけをしようとしていた。彼らは、一連の簡単ではあるが退屈な数え上げを含んだ順序づけの 方法を思いついた。
その結果、マンとホイットニーは一つの検定統計量を得た。その検定統計量の分布は、組み合 わせ論的算術■ウイルコクソンと同じ型の計算 からも得られるものだった。二人はウイル
コクソンの論文が出てからニ年後の一九四七年に、その新しい計算手法を紹介した論文を発表し た。ウイルコクソンの検定とマンHホイットニーの検定は非常に似通っており、P値が同じにな ることがたちまち証明された。
これらの検定統計量はともに目新しいところがあった。ウイルnクソンの論文が出るまでは、 どんな検定統fi量も基本的に分布の母数を推定する必要があると考えられていた。しかし、ウイ ルコクソンの検定は母数の推定をする必要がなく、データから観測された散らばりと純粋に確率 的に期待された散らばりとを比較するものだった。すなわち、ノンパラメトリック検定だったの である。
このよぅにして、統計革命は分布の母数を使ったピアソンのもともとのアイデアを超えて"一 歩先へと進んだのである。今や、母数を利用することなく、測定値の分布を扱えるよぅになった のだ。
西側諸国の研究者の多.くには知られていなかったが、一九三?年代終わりには、ソ連のアンド レイ.コルモゴロフと彼の学生であったN. V ■スミルノフが、母数を利用しない分布の比較に ついて異なるアプローチを研究していた。ウイルコクソンとマン=ホイットニーの研究は、並べ られた順位の根本的な性質に注意を向けることによって数学的研究に新しい領域をもたらし、ま もなくスミルノフHコルモゴロフの研究もそのなかに組み込まれていった。
さらなる発展
いったん新しい領域が数学的研究に現れると、研究者たちはいろいろな方法でその領域を研究 し始めるものだ。ウイルコクソンによるこのオリジナルな研究は、まもなくそれに代わる代替ア プローチに取り込まれた。ヘルマン.チヤー ノフ(Herman chernoff)とI ■リチヤード.サヴ ヱッジ(I.Richard savage)が発見したのは"ウイルコクソンの検定が順序統計R;の期待される 平均値として見なされぅることだった。つまり、元になる分布が異なるものを含む一組の検定 (ただし母数の推定は要求しない)へとノンパラメトリック検定を拡張することに成功したので ある。
一九六〇年代初めまでは、この稱の検定(今では「分布によらない検定」とも呼ぶ)は最新の 研究トピックだった。博士課程の学生は、その理論の隅々まで突きつめていくことで博士論文を 書いた。学会ではもっばらこの新しい理論の議論に時間を割いた"ウイルコクソンはこの領域で 研究を続け' 組み合わせ論における非常に扱いやすい計算アルゴリズムを開発して検定範囲を広 げた。
一九七一年' チェコスロバキアのヤロスラフ*ハイエク(Jaroslav Hdjek)は、権威あるテキ ストを出版し、統計学全般に統一的な見解をもたらした。ハイエクは一九七四年にg八歳で亡く なるが、ノンパラメトリック検定全般の墨礎となる一般概念を発見し、この一般的なアプローチ
を中心極限定理のリンデベルグ=レヴィ条件と関連づけた。これは数学的研究ではよくある方法 である。ある意味で、すべての数学は相互に結びついているが、その結びつきの本質を正しく理 解し、それらを活用する洞察力を得るためには、長い年月がかかるものなのである。
ウィルコクソンは、自らの統計的発見をさらに研究するため、もともといた化学分野を*り、 アメリカン*シアナミド相とそのレダール研究部門の親剖サjビスグループを統括した。』九六 〇年にフロリダ州立大学の統計学部に移り' そこで教師として、また、研究者として尊敬され、 数人の博士課程の学生を指導するようになった。I九六五年にこの世を去ったとき、彼が遺した ものは将来を担う学生とその領域で多大な影響を与ぇつづける統計的革新であった。
解決されていない問題
ノンパラメトリックな手順が開発されたことで、この新分野の動きが一気に加速したかもしれ ない。だが、従来のパラメトリック手法と、ノンパラメトリック手法との関連性は明らかではな かった。解決されていない問題がUつあったのだ。
1データが正規分布のような既知のパラメトリック分布に従うならば、ノンパラメトリック手 法を使うことで解析結果がどれだけ悪くなるのか?
2 データがハラメトリック?モデルにまつたく適合していないならば ノンハラメトリック手
法を用いるほうがょり有効なものとなるために、そのテータがどれだけハラメトリック■モテ
ルから乖離していなければならないか?
一九四八年に、数理統計学論集誌の編集者は一篇の論文を受け取った。ォーストラリアの南海 岸に位置するタスマニア島のタスマニア大学で教鞭をとる無名の数学教授から送られてきたもの だった"この注目すべき論文は、さきのニつの問題を解いていた。エドウィン.ジH1ムズ.ジ ョージ■ピットマン(Edwin James George3|:111310は、それょりさきに王立統計学会誌に:::-篇、 Proceedings of the Cambridge Philosophical society0に'一 篇の論文を発-^していた。だが、 振り返ってみると、それらはのちの彼の研究の土台になるものであったにもかかわらず、無視さ れるか忘れられていた。ピットマンはこの四篇の論文を除いて論文を発表しておらず無名だった し、数理統計学論集誌に投稿したときにはすでに五:.;歳だった。
E. _~J. G .ヒットマンは一八九七年にオーストラリアのメルボルンで生まれた。メルボルン 大学に進学したが、第一次大戦で学生生活は中断され、ニ年間を軍隊で過ごした。その後、大学 に:民って学士号をとった。のちに彼はこう記している。
「尚時、ォーストラリアの大学には数学科の火学院がなかった」
なかには、優秀な学生にィギリスの大学院へ行くための奨学金を出す大学もいくつかあったが、 メルボルン大学はそうではなかった。
r四年間メルボルン大学で勉強して卒業するとき、私は研究面の訓練をまったく受けていなかっ
た"でも、数学を学び応用することは習得したと考えて、目の前の問題になんでも取り組むつも りだった……」
さしあたりの問題はまずどうやって生計を立てるかだった"
タスマニア大学は数学を教える人を探していた。ピットマンはそこに応募し、数学の教授に任 命された。その学科の教員は、新任教授のピットマンと一人の非常勤講師しかいなかった。他の 学科生の数学の授業を受け持たなければならなかったので、新任教授のピットマンは、大学での ほとんどの時間を講義に費やす羽目になった。理事会が常勤の数学教授をー人展おうと決めたと き、ある理事が数学の新分野として統計学があることを聞いていた。そのため、その新任教?の 応募者は、とにかく統計学を教える心づもりがあるかどうか尋ねられた。
ピットマンは「統計理論に対して格別な知識があるとは主張できませんが、任命されたなら、 一九二七年には統計学の講義を開けるょうにします」と答えた。彼は、統計学の理論に関して格 別な知識もなければ、そのほかどんな知識もなかった"メルボルン大学で、統計学の授業を受け る代わりに高等論理学の授業を受けていたのだ。「統計学は興味ある学問ではないけれども、そ のことで煩わされることはないだろうとその場で決めた」とピットマンは述べている。
若いピットマンは、ー九ーー六年秋に大学を出ただけで教授となり、ロンドンやケンブリッジで の知的興奮とは縁違い、小さな州立大学のあるタスマニア州ホバートにやって来た。ニ九三六 年まで一つも論文が出せなかった。その理由は大きくニつある。こなすべき仕事の量と私の生い 立ちにょるものだ」と書いている。これは数学研究手法の彼のトレーニング不足を物語っている。
彼が数理統計学論集誌にすばらしい論文を送った一九四八年ごろには、タスマニア大学の数学 科は大きくなっていた。一人の教授(ピットマン)と一人の助教授に加え、一一人の講師に二人の チユーターがいた。彼らは応用数学から理論数学まで数学の幅広い分野を教えていた。ピットマ ンは週に一二もの講義を抱え、土曜日の授業も受け持っていた。
今や、彼は研究資金の援助を受けるょうになっていた。一九三六年には、オース卜ラリアの各 大学での科学研究を促進するため、政府は年間-::.1万ポンドの資金援助を始めた。この援助は人ロ 比に基づいて州に分配された。そのため小さな州であるタスマニアは、タスマニア大学全体でも 年にニ四0〇ポンドほどにしかならなかつた。この資金をいくらもらっていたのか、ピットマン が言うことはなかった。
徐々にピットマンは異なる研究分野に従事していった。彼が最初に発表した論文は、流体力学 の問題を扱っていたが、次の三篇の論文では仮説検定理論におけるきわめて特殊な内容を扱って いた。それらはすばらしい論文とはいえなかったが、ピットマンの学習論文となっていた。どう やってアィテアを膨らませるかどのょうにして数学構造同±を結びつけるかを研究していた。
一九四八年の論文にとりかかっていたころ、ピットマンは、統計的仮説検定の性質について、 また古い(パラメトリック)検定と新しい(ノンパラメトリック)検定との相互関係について、 明確な一連の論拠を開発した。この新手法を用いて、さきのニつの未解決の問題に取り組んだの である。
彼の発見はみんなを驚かせた"もともとの仮定が正しいときですら、ノンパラメトリック検定
はパラメトリック検定とほぼ同程度に優れた手法なのである。ピットマンは、一番目の問題に答 えることができた。
「パラメトリック‘モデルを知っていて特定のパラメトリック検定を使うべき状況で、もしノン パラメトリック検定を使、っとどれほど悪くなるのか?」
「まつたく悪くはならない」とピットマンは言つた。
二番目の問題に対する答えはみんなをいっそう驚かせた。
「データがあるハラメトリック■モテルにまつたく適合していないならば、ノンハラメトリック 手法を用いるほうがより有効なものとなるために、そのデー夕がどれだけパラメトリック■モデ ルから乖離していなければならないか?」
ピットマンの計算では、パラメトリック.モデルからわずかでもずれていれば、ノンパラメト リック検定のほうがパラメトリック検定よりもずっとよくなったのである。
これはあたかもフランク■ウイルnクソンが"きっと化学者である自分よりも前に誰かがこん な簡単な発見をしているだろうと思っていたにもかかわらず、まるで賢者の石を偶然発見したよ うなものだった。ピットマンの結果から、すべての仮説検定はノンパラメトリック検定で行うベ きであると提案された。ピアソンによる母数に茶づいた統計的分布の発見は、統計革命の第一歩 でしかなかった。今や統計学者は特定の母数に煩わされることなく、統計的分布を扱うことがで きるようになつた。
数学には巧妙に見えるなかにも狡猾さが潜んでいることがある。ウイルコクソン、マンHホイ
ットニー、ピットマンたちの一見簡単そぅに見えるアプローチの奧底で、彼らはデータの分布に 対するさまざまな仮定を暗に設定していた。こぅいった仮定が理解されるまで、さらにニ五年も かかつたのであるし
最初の困った問題は、一九五六年シヵゴ大学のR . R -パハデュールとL . 1(ジミー.)サ ヴヱッジにょって発見された。数年後、私がバハデュールとサヴヱッジの論文をインドから来た 友人に見せたところ、友人は彼らの名前の妙に気がついた。「パハデュール(Bahadur)」はヒン デイー語で「戦士 (warrior)」を意味する。戦士と蛮人(savage)が、ノンパラメトリックな統 計的検定に最初の一撃を加えたのである"
サヴェッジとパハデュールが暴き出した問題は、まさにウイルコクソンのノンパラメトリック 検定にそもそものきっかけを与えた問題??外れ値の問題??から来ていた。外れ値がめったに なく、それらが完全に「間違0た」観測値であるなら、ノンパラメトリック手法はそれらの解析 への影響を小さくすることになる。もし、外れ値がデータの系統的な悪影響の一部であるならば、 ノンバラメトリック手法への移行は事態を悪くするだけかもしれないのだ。悪影響をもたらす分 布の問題は第23章で扱ぅことにしょぅ。
力ール.ヒアソンにとって、確率分布とはデータ収集によって検証されうるものであった。十 分なデー夕が集められれば、そういった確率分布がすべてのデータを代表するものにできると考 えていたのだ。バィオメトリ力誌の連絡担当委?は' 古代の墓地から何百という頭蓋骨を集め、 狩?用の散弾を詰め込んで、その?量を測り、これら何百のデ|タをピアソンに送ったものだっ た。ある連絡担肖委貝は中央アフリヵのジャングルを旅して何百人もの原住民の腕の骨の長さを 測定し、そのデータをピアソンの生物測定研究所に送ったりした。
しかしながら、ピアソンの手法には根本的な欠点があった。ー3うなれば「便宜標本(0で portunitysample)」なるものを集めていたのである。それらのデータは、最も入手しやすいもの だったが、本当の分布を正しく代表しているとは限らなかった。頭蓋骨の容量を測るために発掘
された墓地もたまたま見つかったものであって、発掘されていない墓地は未確認のままであり、 異なるものかもしれないのだ。.
便宜標本のこういった失敗の具体例が一九三〇年代初めのィンドであった。ジユートの梱がョ ? 口ッパへの船積み用にボンべィの埠頭に集められていた。ジユートの価格を決めるため、それ ぞれの梱からサンプルがとられ、ジユートの品質が決められた。なかが空洞になった円筒形の小 剣のようなものをシユートの栖に突き刺してき抜き筒のなかに入ったシユートをサンプルと して抽出した。
梱包され船積みを待つような状況では、えてして梱の外側に近いほど質は悪くなりがちであり、 反対に内側になるとぎっしり詰まった状態で、特に冬場などは:;:部が凍ってしまうほどだった。 サンフルをとろうとすると、詰まった部分や凍ってしまったところは突き刺すことができずにそ らしてしまい、するとほとんどのサンプルが外側の質の悪い部分に偏ってしまう。便宜標本とは、 このように梱全体では質が高くても、質の劣ったほうに偏ったものであった。
プラサンタ■チヤンドラ‘マハラノビス(prasanta Chandra Mahalanobis)教授は、カルカツ タにあるプレジデンシー大学の物理学部長だったが、なぜ便宜標本が信用できないかを明らかに するために、さきの例(ジユートを埠頭に輸送する鉄道会社で働いていたときに彼が発見したも の)をよく引き合いにだした。
マハラノビスはカルカッタの貿易商人の裕福な家の出身だったので、科学や数学に対する彼の 興味に従って大学や大学院に行くことができた。一九二?年代に彼はィギリスに渡り、ピアソン
とフイッシャーの両者のもとで学んだ。F ? N -デイヴイッドのような学生は奨学金の助けが必 要だったが、マハラノビスは研究をつづけるあいだ、貴族のような生活を送っていた。彼はイン ドに戻って、プレジデンシー大学の物理学部長になった。その後まもなくして一九三一年に自分 の資産を使って、家族の土地の一つにインド統計研究所を創設した。
インド統計研究所で、マハラノビスは優秀なインドの数学者や統計学者を集めて教育した。彼 らの多くはその分野で重要な貢献をした^?たとえば、s . N . ロイ(S.N.ROy)、C ■ R .ラオ pK.Rao)、R . C * ボース(fdpBose)、p . K -セン(P.K.Sen)、マダン-プーリー(Madan Puri)といった人たちである。
マハラノビスの興味の一つは、代表となる標本データをいかにして適切につくるかとい、っこと にあった。多くの場合、ある集合においてすベての測定値を求めるのがほとんど不可能であるこ とは明白だった。例を挙げよう。インドの人口はとても多いので、アメリカで実施されているよ うな、iHで完全な人?の調査をすることなど長年のあいだ行われてこなかった。その代わりに インドでの人口の一斉調査は一年以上かけて行われ、州が異なれば調査する月も異なるものであ った。このため、インドの人ロ調査は決して正確なものとはなり得ない。出生、死亡、移住や調 ?期間中の身分の変化などが起こるからだ。ある日のインドにどれだけの人がいるかを正確に知 ることなんて誰にもできないだろう。
マハラノビスは、もし大きな母集?を適切に代表する小標本を集められれば、その母集団の特 徴を推定できるはずだと推論した。ここで、可能性のある二つのアプローチに出会ったことにな
る。一つは、「裁定標本(judgment sample)」を構築することである。裁定標本において"大き な母集01のなかで異なるいくつかのグループを表すのに選ばれた個々の標本を選ぶにあたり、そ の母集団に関する知識は何でも使われる。
どれだけの人があるテレビ番組を見ていたかを調?するニールセン視聴率は、裁定標本から作 成されている。ニールセン.メディア■リサーチ社は、社会経済的な状態と住んでいる国の地域 とによつて、標本となる家族を選んでいる。
一見すると裁定標本は、大きな母集団の代表的な標本を得るのに適した方法だと思うかもしれ ない。だが、二つの大きな欠点がある。;つめの欠点は、自分たちがその母集団について十分な 知識があるから代表となる特定の小標本を選ぶことができるのだと確信できるときに限って、そ の標本は代表的なものとなる、ということだ。もしもその母集団についての知識が豊富であれば、 たぶん標本をとる必要もないはずである。なぜなら、その標本に対して行われる質問は、その母 集Mを同等なグループに分けるのに必要とされる質問であるからだ。
ニつめの欠点はもっと厄介である。裁定標本の結果が間違っている場合、その結果が真実から どれくらいかけ離れているかを知る術がない、ということだ。ニ〇〇〇年の夏、ニールセン-メ ディア.リサーチ社は、標本に十分なヒスパニック系家族を含まずにスペイン語のテレビ番組の 視聴率を過小推定していると非難された" 、
マハラノビスの引き出した答えはもう一つのアプローチ「無作為標本(random sample)」で あった。今では大きな母集団から個体を選ぶのに無作為抽出を行っている。この無作為標本から
得られた値はおそらく妥当ではない。しかし、数理統計の定理を使うことで、最適な方法j^長 期間、何度もくり返せば無作為標本による値が他の値よりも真の値に近づくことが確信できる方 法??で、どのように標本をとって測定するか決めることができるのである。さらに、無作為標 本における確率分布の数式もわかっており、推定したいものの真の値を含む信頼区間すらも計算 できるのである。
したがって、無作為標本は便宜標本や裁定標本に比べてよいのである。というのも、正しい答 えを保証するからではなく、高い確率で正しい答えを含むような答えの幅を計算できるからなの
だ0
ニユーデイール政策と標本
標本理論の数学は一九三o年代に急速に発展した。マハラノビスのインド統計研究所において、 また一九,::::一 〇年代後半のネイマンの二つの論文から' そしてニユーデイール政策の初期のころに ワシントンDCに集った大学を出たばかりの熱意あふれる若者たちによって。人々の大きな母集 団からいかにして標本をとるかという多くの実際問題が、連邦政府の商務省と労働省にいた若き ニユーデイール政策の支持者たち(ニユjデイーラー)によって取り組まれ、解決されたのであ る。
1九三ニ年から三九年にかけて学士号を得た若者たちはほとんど、大学を出てから仕事のない
世界へと旅立った。世間は大恐慌の真っ只中だった"マーガレット■マーティン(Margaret Martin)はニユーヨークのヨンカーズで育ち、'ハ'?K1ド大学に進学し、やがてアメリカ予算c の職員になった。.彼女はこう記している。
一九三三年六月に大学を卒業したとき、仕事を見つけられなかった……友だちの一人は一 年遅れの一九三四年に卒業したが、とても幸運だった。彼女は、B ■アルトマン百貨店の販 士冗の仕事を得て、週に四八時間働き、一五ドルの収入にありついたのである。しかし、そう いった仕事でさえ比較的まれだった。バーナード大学の就職課にフローレンス.ドーティ女 史がいた。私は彼女のところに行き、キャサリン.ギブズ秘書学校に通うかもしれないこと について相談した。どこでその資金を得たらいいのかわからなかったが、少なくとも職に就
くための技術か身につけられるのではないかと考えた。K ティ女史は. hつき合いやすい
人とはいえず、多くの学生が彼女を恐れていたが 彼女は私に、「秘書コースを受けるな
んて決して勧めないわ!タイフライターを学んで使えることを見せれば、タイプライター を使う仕事以外何もさせてもらえなくなるわ あなたは専門職を探すべきょ」と一喝した。
マーティンはやがて、アルバニーにあるニユimlク州雇用失業局の調査統計課で下級エコノ ミストとして初めての仕事を得て、研究を進めるための足がかりとした。
ほかにもニユーディーラーとなった若者たちがいる。彼らは卒業と同時にワシントンへやって
来た。モーリス?ハンセン(MorrisHansen)はワイオミング大学経済学部の学士号を携えて、 一九一一:三年にセンサス(国勢調杳)局へやって来た。彼は' 初の包括的な失業調査を計画するに あたり、大学で学んだ数学とネイマンの論文から得た付け焼き刃の知識を使った。ネイサン.マ ンテル(NathanMantel)はニユーョーク市立大学で新たに生物学の学位をとり、国立がん研究 所に又った。ジエローム.コーンフィールド(」631116 003&£.{1)もニユーョーク市立大学で歴 史学を専攻し、労働省でアナリストの仕事に就いた。
政府にとってみればおもしろい時期であった。国は停滞し、多くの経済活動が正常に機能せず、 ワシントンの新政府はなんとか活路を見出そうとしていた。まず、どれほど悪い環境が国を覆っ ているかを知る必要があった。雇用と経済活動に関する調査が始まった。アメリヵ史上初めて、
Mに何が起こっているのかを正確に?定する試みがなされようとしていた。それは標本調?を行 う絶好の機会だった。
熱心な若者たちはとりもなおさず、数学をわかっていない人々の異議に打ち勝たねばならなか った。労働省の初期調査の一つで判明した、国内人口の一〇%以下が?民全所得の四〇%を占め ている実態を明らかにしたとき、アメリカ商工会議所に公然と非難された。これが本当であると どのように証明できるのか。調査では労働人口の〇.五%以下しか対象にしておらず、しかも調 奄対象はランダム(無作為)な方法で抽出されているのに!
商エ会議所でも、?に何が起こっているかについて職員の意見を取り入れて、独自の調査を行 っていた。センサス局によるこの新たな調査は、デー夕がランダムに選ばれているから不正確だ
という商エ会議所の判断で退けられてしまった。
一九三七年になると政府は失業率の全数調杳を計画し、議会は三七年度失業センサスを認可し た。議会で可決した法案により、すべての失業者は登録カードに必要事項を記入して近くの郵便 周に届け出なくてはならなくなった。当時、失業者の推定値は三〇〇万人から一五oo万人とも 見積もられていたが、ニユ131クで実施された::、三のランダムな調奄だけが唯一まともな数 値であった。
センサス局でカル' デドリック(calDedrick)とフレッド-ステファン(Fredstephan)に率 いられた若い社会学者たちは、調奄に非協力的な失業者が多く、得られた数値には未知の誤差が かなり含まれていることに気づいた。そこで、全国規模の第一回の本格的なランダム調?が行わ れることになった。若いモーリス.ハンセンが調査を計画し、センサス局は全郵便配達区域の ニ%をランダムに選んだ。その区域の配達貝が郵便区域内の全家庭に質問票を配った。
たったニ%の標本とはいえ、センサス局は膨大な質問票に圧倒された。郵政公社はそれらをま とめて、結果を表にしようとした。ところが、質問票は家族構成や回答者の職Mについての詳細 な情報を集めるようにつくられていたので、そんな大量の詳細な情報をどうやって検証すればい いのか、誰にもわからなかった。読者に思い出してもらいたいのだが、この調杏が行われたのは コンビユータが現れる前であり、紙と鉛筆による表作成の助っ人は手動式計算機だけだったので ある。
ハンセンは、調?計画の基礎となった論文の著者、ィヱジ 不ィマンに連絡をとった。ハン
センにょれば、最も重要な質問に対する答えを見つけるために、「すべてのケースを知る必要も なければ、すべての関係を理解する必要もない」とネイマンは教えてくれたそうだ。ネイマンの アドバイスのおかげで、ハンセンと同僚たちは、質問票の大部分を占める複雑で紛らわしい詳細 な情報は無視して、失業者数を数えていった。
これらの小規模なランダム調査が従来の裁,,疋標本ょりも正確であることを証明するために' ハ ンセンの指揮のもと、センサス局は一連の入念な研究を進め、ついに(労働省)労働統計局と (商務省)センサス局は無作為標本の新しい手法を開発した。ジョージ*ギヤラップ(George Gallup)とルイス*ビーン(Louis Bean)は' これらの手法を政治の世論調?の領域へ取り入れ
ー九四0年の国勢調査に向けて、センサス局は国勢_査のうちの標本調査について念入りに計 画し始めた。そこには若く新たに雇われた統計学者のウイリアム-ハーウイッツ(William Hunvitz)がいた。ハンセンとハーウイッツは親密に協力し合い、友だちになつた。二人は共同 で一連の重要かつ影響力のある論文を発表し、一九五三年には共著書『標本調沓の手法と理論 (sample Surveだ Me/Jwds and Theory/)一(もう一人ウイリアム-マドウ〔wiui_MadowJ も共 著者である)を出版した。このハンセンとハーウイッツの論文や著書は標本調査の領域でとても 重要なものとなり、また頻繁に引用されたので、この領域の多くの研究者は、ハンセン-ハーウ イッツ(Hansen Hurwitz)という名の人物がいると信じるまでになつた。
シエロ' ?ム.コ■ ~ンフイ^~ルド
ニユーデイ?ル政策のあいだにワシントンに来た多くの若い研究者たちは、政府や学界で頭角 を現すょぅになっていった。そのなかには、新しい数学的問題を解決したり、統計手法をつくる
のに忙殺されて、学位をとれない者もいた。その最たる人物が、シエロ ^ .コーンフイールド
である。
コーンフイールドは労働統計局でこれらの初期調査に携わったあと、国立衛生研究所に移った。 彼は学界の著名な研究者と共著で論文をいくつか発表した。また、ケース.コントロール研究の 数学的間題も解決した。彼の科学論文は多岐にわたり、無作為標本理論に始まって、雇用バター ンの経済問題、ニワトリの腫瘍調査、光合成に関する問題、.環境毒素が人体に与える影響にいた るまで幅広い。彼はまた多くの統計手法を開発し、今日では医学、毒物学、薬理学、経済学の分 野で標準的な手法となっている"
コーンフイールドの最も重;要な業績の一つは、;九四八年に始まったアメリヵのフラミンガム 研究の計画と初期解析である。そのアイデアは、「典型的な町」としてマサチユーセッツ州フラ ミンガムを選び、全住民の多数の健康に関するデータを測定し、それを数年間にわたって追跡調 ?するものだった"この研究は今なお続いており、すでに五〇年を越えている。ときどき政府の 予算削減のために研究資金がヵットされたりするょぅな「ポーリーンの危機【M\:^mT^n:M
8^代一^:へ韻5」的存在であった。この研究は今でも、食生活とライフスタイルが心臓病 とがんに与える長期的影響に関して、主な情報源となっている"
フラミンガム研究から最初の五年分の.デー夕を解析するにあたって、コーンフイールドは理論 的考察では扱っていなかった根本的な問題に出くわすことになった。そして、プリンストン大学 の教授らと協力して、これらの問題を解決した。その仲間は、コーンフイールドが着手した理論 的発展についての論文を作成したが、彼はその手法を見つけただけで満足していた"一九六七年 に彼は、共著者としてその研究をまとめた最初の医学論文を発表した。それは、高コレステロー ルが心臓病を引き起こす確率に影響を与えていること示した初めての論文だった。
私とコーンフイールドはある委員会の一員で、一九七三年のある議会の委員会に先立って開か れた一連の公聴会に招集された。休憩中にコーンフイールドは電話で呼び出された。呼び出した のは、コロンビア大学の経済学者ヮシリー?レオンチHフ(Wassily Lsntief)で、「たった今、 ノーベル経済学賞を受賞した、共同研究でnhンフイールドが担った役割に対して感謝したい、 それゆえの受賞であるから」といぅものであった。この研究は、レオンチェフが助力を求めて労 働統計局に来た一九四〇年代後半になされたものだったのである。
レオンチHフは、経済がセクター(産業)ごとに分類しぅるものと信じていた。たとえば農業、 鉄鋼業、小売.業などに分類して関連性を考えるのだ"各セクターは、他のセクターからのモノや サービスを使ってモノやサービスを生産し、それをまた他のセクターへと提供する。この相互関 係はある数学行列の形式で記述できる。いわゆる「投入産出分析(inputloutput analysis)」だ。
レオンチェフが第二次大戦の末期にこのモデルを最初に調べ始めた際、必要なデータを集める手 助けをしてもらうために労働統計局へ行った。彼の助手として、当局は当時そこで働いていた若 いアナリストでぁるシェロ ^ ■コーンフイjルドに白羽の矢を立てた。
レオンチェフは経済がニ、三の大まかなセクターに(たとえば全製造業を一つのセクターに、 など)分割できるかもしくはそれらのセクターをもう少し細かく分割できるだろうと^えてい た。投入産出分析の数学的理論では、経済を記述した行列は唯一の逆行列を持つことが求められ る。つまり、いったんデータが集められると、その行列は「逆行列をとる(inverting the matrix)」という数学的操作を満たさなくてはならないのだ。
当時はまだコンビユータが普及していなかったので、逆行列を求めるのは計算機を使って難し く退屈な作業をするしかなかった。私が大学院生だったころ、学生はみんな逆行列を計算しなけ ればならなかった。それは「私たちの魂のための」一種の通過儀礼でぁるに違いないと思ってい た。私は5X5行列の逆行列を求めるのに数0かかったことを覚えているが、その大半は計算間 違いを探すこととその間違いのやり直しとに費やしたのだった"
レオンチェフの初期設定のセクターは12X12行列となって、コーンフイールドはそれに唯一の 解がぁるかどうかを調べるために、12><12行列の逆行列を求めることになった。この作業には一 週間もかかり、最終結論はセクター数を拡張せざるを得ないというものだった。不安になりなが ら、コーンフイールドとレオンチHフはセクターを細分割していき、実行可能だと考えられるな かで最も簡単な行列、24\24行列にたどり着いた。ニ人ともこれがー人の人間の扱える能カをは
るかに超えているとわかっていた。コーンフイールドは、24;<24行列の逆行列を求めるのにー週 間に七日働いたとしても数百年かかるだろうと推定した。
第二次大戦のあいだ、ハーバード大学は最初のとても原始的なコンビユータの一つを開発して いた。それは機械的なリレースイッチを使っており、よく故障した"戦争が終わり、もはやこの コンピユ?タが必要なくなると、この怪物のような機械の使い道を模索し始めた。そこでコーン フイールドとレオンチエフは24><24行列をハーハード大学に送って通朝マーク-~^コンピユータ に退屈な計算をさせて逆行列を求めさせようとした。
彼らがこのプロジHクトの支払いをしようとしたところ、労働統計局の会計係から支払いを止 められた。当時、政府の政策は「物品には支払うが、無形のサービスには支払わない」だった。 その理屈は、政府はサービスするための専門家をあらゆる業種に対して持っているからというも のであった。何かしなければならないのであれば、政府のなかにそれができる人間がいるはずだ、 と。
二人は政府の会計係に、これは理論的には人間のできることではあるが、生きているあいだに できるものではない、と説明した。会計係は同情してくれたが、その規則の抜け道を見つけるこ とができなかった。そこでコーンフイ?ルドはある提案をした。その結果、政府はとある物品に 対し購入注文書を発行した。それはどんな物品だったのか?仕入書によれば、政府はハーバー ド大学から「一つの錬型(one matrix)、反転もの(inverted)」を購入することになったのであ
経済指標
ニユーデイール政策の初期段階で政府に飛び込んだこれらの若い男女による仕事は、国家にと っていまだ根本的な重要性を持ちつづけている。この仕事は今や、経済を軌道修正するよぅにな っている定期的な一連の経済指標を導くことになった。これらの指標には、(インフレに対する) 消費者物価指数をはじめとして、(失業率に対する)最新の人|:-|調?、エ業調奄、ー〇年ごとの 全人n調査によるセンサス局推定値の中間調整、そして多くのそこそこに知られた調査が含まれ ており、これらの調査は世界のすべての工業国で模倣され、利用されている。
インドでは、マハラノビスがインドの新政府が誕生したときの総理大臣ジャワハラル■ネール (JawaharlalNehru)の個人的な友だちになっていた。マハラノピスの影響下で、この新しい国 家経済に本当に何が起こっているのかを示す標本調査が慎重に行われることによって、ソ連国家 中央計画を真似たネールの試みは頻繁に修正された。ロシアでは、支配者たちを喜ばせるために 官僚が生産高や経済活動の偽りの数値をつくった。インドでは、真の姿からあまり離れていない 数値がいつも入手できた。ネールとその後継者たちは好むと好まざるとにかかわらず、それを扱 わなくてはならなかった。
一九六ニ年にR + A-フイッシャーはインドへ行った3^|?|,:^、0彼はマハラノビス の誘いでたびたびインドを訪れていた。だが今回は特別だった。インド統計研究所(ISI)の
設立三〇周年を祝ぅため、世界中の著名な統計学者にょる大会議があったからだ。フィッシャー」 ネイマン、エコン■ヒアソンハンセン、コ^ ?yブィ,^ルドそしてアメリカやヨ,^ロッハから 多くの統計学者が一堂に会した。どのセッションも活気に満ちていたが、とりわけ多くの未解決 問題を抱えた数理統計の分野は大盛況だった。
統計解析の手法は科学のどの分野にも浸透していた。新しい解析手法が常に提案され、検証さ れていた。主題別に四つの(科学)学会と少なくとも八つの学術雑誌(その一つはマハラノビス にょって創刊された)ができていた。
会議が閉幕すると、参加者たちは各自別々に帰っていった。彼らが帰宅すると、ある訃報が届 いた。フィッシャーがオーストラリアの新しい自宅に戻ってまもく、亡くなったといぅ知らせだ った。七ニ歳であった|--1||<--'7ィ'§以|^故?|ほ尨£|3§"彼の科学論文は五卷本にまとめ られ、七冊の著書は統計学のすべての分野に影響を与えつづけているが、彼の輝かしい独創的な 業績はここで終わりを告げたのである。
一九五八年にR ■ A .フィッシヤ1は〇071^7171^1?&1^&1〇誌に論文「タバコ、がん、そして 統計(cigarettesoancer, and statistics)」を発表し、またネイチヤー誌にニつの論文「肺がんと タバコ? (Lung cancerandGigaretts?)」「がんと喫煙(cancer andsmoking)」を発表した。彼 はこれらの論文に長い序文をつけて、「喫煙??がん論争証拠をチHックするためのいくつか の試み(smoking: the Cancer Controversy. Some Attempts to Assess the Evidence)」といぅタイ トルのパンフレットにした。フイッシヤー(パイプを吸っている姿がょく撮影されている)は、 喫煙が肺がんを引き起こすことを示そぅと0論まれた証拠には欠陥だらけであると強く主張した。
当時、喫煙とがんの研究に抗弁したのはフィッシヤーだけではなかった"メイヨー.クリニッ クのH席統剖学者であり、アメリカ生物統剖学者のリーダーの一人であるシヨゼフ.ハークソン
(Joseph 8?^目)も、やはりその結果に疑問を里した"イエジー.ネイマンは肺がんと喫煙に 関する研究で使われた論法に異議を唱えた。なかでもフイッシャIの攻撃は情け容赦がなかった。 バークソンとネイマンは証拠が数年にわたって蓄積されると、その関連性が証明されたことに納 得したが、フイッシャーは頑としてはねつけ、データを改竄していると研究の第一線にいる者た ちを責め立てた。その姿に多くの統計学者は途方に暮れた。当時、タバコ会社はそういった研究 の妥当性を否定し、それらは単にr統計的相関関係」にすぎず、タバコが肺がんを引き起こす証 明にはならないと指摘した。それはj見、フイッシャーは彼らに賛同しているかのようだが、彼 の議論は論客の様相を呈していた。例として、ここに彼の論文の一つから、あるパラグラフを引 用しよ、っ。
(そういった関連性を示す研究に対して)綿密な吟味が必要なことは、一年前にイギリス医 師会の雑誌に掲載されたとても説得力のある一つの注釈によって痛感させられた。そこでは、 いかなる?代広報の手段を使ってでも、世界に広くこのひどく危険な寧実を十分理解させる ように図られるべきである、というほとんど感情むき出しの結論に至っていたのである。こ の注釈を読んだとき、私は「いかなる現代広報の手段」も好ましいとは思えなかったし、道 徳的分別がこの点でつけられるべきだとは思えなかった。……そのプロパガンダが反対しよ うとしている特定の習慣について、世界中のおそらく数百万の喫煙家が心配すべきことを知 らないからといって' 彼らに恐怖心を植えつけること??すなわち税金を使い、あらゆる現
代広報を用いて恐怖心を抱かせること は、善良な市民のすることでは決してない 。
あいにく、この恐怖心を広めるために使われた政府のプロパガンダに対してフイッシャーは怒 ってはいても、反対する理由を明確に述べていなかった。愛するパイプをやめるなんてさらさら 思っていない偏屈な年寄りの役を彼が演じている、というのが世間一般の通念となった。一九五 九年にはシヱローム.コーンフイールドが国立がん研究所(NCI)、アメリヵがん協会、そ してスローンHケッタリング研究所出身の五人の著名ながん専門家と共同して、それまでに発表 された全研究を概説した三〇ぺージにわたる論文を書いた。
彼らは、(タバコ会社の代表としての)タバコ協会による反論ならびにフイッシャー、バーク ソン、ネイマンの異論を検討した"そして、その論争に対して注意深く筋の通った説明をし、 「人の肺における類表皮がんの罹患率が急激に増加している要因の一つに喫煙がある」ことを指 し示す証拠がいかに圧倒的であるかを示した。
これにより、医学界全体に軍配が上がった。タバコ協会は引きつづき、大衆雑誌に一面広告を 載せて統計的相関だけによる関連性に疑問を投げかけたが、この発見に異議を唱える論文は一九 六〇年以降、信頼できる科学雑誌には掲載されなくなった。それから四年と経たないうちにフイ ッシャーは亡くなった。彼は議論を続けることができなくなり、またほかの誰もその議論を取り 上げようとはしなかった。
原因と結果、そんなものは存在するのか?
それはすべて、じゃまされることなくパイプを燻らせたい老人によって提唱された多.くの戯言 だったのだろうか、あるいは、フイッシャーの異議には何かほかに真意があったのだろうか。 フイッシャーの喫煙とがんに関する論文を読み、さらにさかのぼって帰納的推論の牲質および統 計的モデルと' 科学的結論との関係についての彼の以前の論文を読んで、それらを比べてみた。 すると、一貫した論拠が浮かび上がってきた。フイッシャーは深遠な哲学的問題を扱っていたの である。その問題とは、イギリスの哲学者パ?mフンド.ラッセル(Bertrand Russell)が一九 三?年代初めに取り組んだものであり、科学的思考の核心を揺るがすものであり、たいていの人 は問題として認識すらしないものである。つまり、「原因と結果」はいったい何を意味するのか ……この疑問に答えるのはそうたやすいことではない。
バートランド.ラッセル卿は多くの読者にとって、白髮で祖父のように優しそうで世界的に名 高い哲学者として記憶にあるかもしれないが、彼は一九六〇年代のベトナム戦争でアメリヵの関 与に対して批判的な声明を出してもいる。そのころには、ラッセル卿は一:?世紀における哲学の 偉人の一人として、学界だけでなく'広く一般に認められていた。彼の最初の大きな仕事は、彼 のかなり先輩であるアルフレッド-ノース.ホワイトへッド(Alfred North whitehead)との共 著で、算術と数学の哲学的基礎を扱った。タイトルは『プリンキピア.マテマテイ力(P3.S-
cipiaMathemaiica)』で、集合論で扱う簡単な公理において、数や足し算のような数学の基本 的なアイデアを確立しようと試みたものだった。
ラッセル=ホワイトヘッド研究で不可欠なツールの一つは記号論理学で、ニ〇世紀初頭の偉大 な発明の:つとなった研究手法であった。読者は論理学と聞けばまず、「すべての人は死ぬ。ソ クラテスは人てある。よつてソクラテスは死ぬ」といつたアリストテレス論理学を思V出す力も しれない。
これはほぼニ五〇o年ものあいだ教えられてきたことだが、アリストテレスの論理を成文化し たところで、さほど役に立つ代物ではない。それは、明らかなことをくどくどと論じ、何が論理 的で何がそうでないかについて恣意的なルールを設定し、そのうえ唯一、論理学が活用されて新 しい知識を生み出すことに成功した数学の論証のような論理の使い方を真似ることにすら失敗し ているのである。ソクラテスの死とワタリガラスの羽の黒さに基づいた論理の類別化を学生たち がうやうやしく覚えているあいだに、数学者たちはアリストテレスの分類にうまく当てはまらな い論理手法を用いて、微積分のような新しい思考の領域を発見した。
一九世紀最後の数年とHO世紀最初の数年における集合論と記号論理学が発達するにつれて、 このような論理手法は一変した。初期の形式、すなわちラッセルとホワイトヘッドが利用した形 式において、記号論理学は「命題」として知られた思考のアトム(原子)から始まる。
各命題は「T」もしくは「F」と呼ばれる真理値を持つ。そういった命題は、「かつ(and)」、 「または(or)」、「ではない(not)」、「等しい(equals)」に対するシンボルと結びついたり比較
されたりする。原子命題はそれぞれ真理値を持つので、それらの任意の結合も真理値を持つ。そ れらは一連の代数的な方法によって計算されうるのである。この簡単な基礎づけによって、ラッ セル、ホワイトヘッド、他の研究者たちは、数や算術を記述したシンボルの結合をつくることが できた。さらにすベての論述の型を記述するかのように思えた。
たった一つを除いては!「八が原因で6となる」を意味するー組のシンボルをつくる方法が ないように思えたのである。因果関係の概念は、論理学者がそれを記号論理学のルールのなかに 押し込めようと精いっぱい努力しても果たせなかった。もちろん、私たちは誰でも「因果関係」 が何を意味するのか知っている。たとえばこうだ。もし浴室の床にガラスのコツプを落とせば、 それは壊れる。犬が間違った方角に進もうとするのを飼い主がいつも止めていれば、犬は正しい 方向に行くことを学ぶ。農業主が作物に肥料を使えば、作物はより大きくなる。妊娠初期0ニ力 月間)に妊婦がサリドマイドを服用すれば、先天性の欠損症の子供が生まれる。婦人が骨盤内炎 症にかかっているならば、それはIUD (子宮内避妊具)を使ったためである。ABC会社の経 営陣に女性がほとんどいないならば、管理者の側に偏見があることになる。私のいとこがすぐ力 ツとなる性格ならば、彼はしし座の生まれだということになる。
バートランドこフッセルがー九三0年代初めにかなり効果的に示したように、原因と結果の共 通概念とは矛盾した概念である。原因と結果のさまざまな例を、同じ段階の根拠に基づいて両立 させることはできないのだ。実際、原因と結果というものは存在しない。それは通俗的な妄想で あり、純粋理性の攻撃に耐えられないあいまいな概念なのである。それは矛盾したアイデアにお
いて相互に一致しないものを含んでおり、科学的震説においては、ほとんど、もしくはまったく 価値を持っていないのである。
実質含意
因果関係の代わりにラッセルは、記号論理学の周知の概念、いわゆる「実質含意(Material Implication)」を使うように提案した。原子命題の原始的概念と「かつ(and)」、「または(or)」、 「等しい(equals)」という結?シンボルを使って、「命?一九世紀の終わり、ドィツ人医師のロべルト■コッホ(RobertKoch)は、ある特定の感染力 を持つ病原体が固有の病気を引き起こすことを示すために必要な前提条件を挙げた。それらの前 提条利は次のようなものである。
1病原体が培養で検出されたときはいつでも、その病気が存在した。
2病気が存在しないときはいつでも、病原体は培養で検出されなかった。
3病原体が取り除かれたときは、病気もなくなつた。
コッホは実質含意に対する条件をやや冗漫に記述していた。この条件は、ある特定のパクテリ アがその感染症を引き起こすと決定するには適当かもしれない。しかしながら、喫煙とがんのよ うなものになると、コッホの前提条件はほとんど価値がない。
肺がんと喫煙との関係がコッホの前提条件にどれほど当てはまるかを考えてみよう(そしてラ ッセルの実質含意にも)。ここでの病原体は喫煙歴であり、病気は肺の類表皮がんである"肺が んにならない喫煙者もいる。このことからコッホの第一条件は合わない。肺がんになつたが喫煙 者ではないと主張する人もいる。その主張を信じるならば、コッホの第二条件も合わない。がん のタィプを小細胞がん(燕麦細胞がん)に限定すれば、非喫煙者でこの病気に罹る人数はゼロと なり、第二条件は適合する。病原体がなくなる、すなわち患者がタバコをやめても、まだ病気に なる可能性は残るので、第三条件も合わない。
コッホの前提条件(とそれに伴うラッセルの実質含意)を適用するにしても、それに合致する 唯ーの病気は急性のもので、体内の血液やその他の体液で培養?能な感染症の病原体によつて引 き起こさる。これは、心臓病、糖尿病、喘息、関節炎や小細胞がん以外のがんには当てはまらな
y o
V
コ^?ンフィ^?ルドの答え
コーンフィールドと五人の優れたがん専門家による;九五九年の論文に話を戻そう。そのテー マに関して行ってきた各自の研究内容をすべて記した。もともと一九五ニ年にイギリスの医学雑. 誌 B M J (£3.豸ダ Me&caJouma)に掲載されたリチャード* .F?ル(Richard Doll)と A . ブラッドフ才iド.ヒル(A.BradfoaHill)による研究があった。ドールとヒルはイギリスで肺 がんによる死亡者数が急速に増えていることに警鐘を鳴らしていた。二人は肺がん患者を数百人 探し出し、同時期に同じ病院に入院しているが、肺がんには罹っていない似たような患者(年齢、 性別、社会経済上の地位が同じ患者)を見つけた。肺がん患者内の喫煙者数は、そうでない(こ の種の研究では「対照〔コントロール〕」と呼ばれる)患者内の喫煙者数のほぼー〇倍であった。 一九五八年末までに、この種の研究が五つ??スカンジナビア、アメリカ、カナダ、フランス、 そして日本??の患者を対象に行われた。それらはすべて同じ結果になった。つまり、がん患者 における喫煙者の比率は、対照群における喫煙者の比率よりはるかに大きかったのである。
これらは「後向き研究(retrospective study)」と呼ばれる。この研究は病気から始まり、発病 以前のどんな条件がその病気に関連しているかを逆向きに調べるのだ。患者の発病以前の条件が その病気に関連しているが、患者の一般的な特性には関連していないことを確信するために、 (その病気に罹っていない患者の)対照群が必要となる。これらの対照群が病気の患者にうまく
対応していないと' 非難を浴びる羽0になる。
有名な後向き研究の一つがヵナダで実施された。それは、人工甘味料が膀胱がんに及ぼす影響 についての研究だった。この研究は人工甘味料と膀胱がんとの関連性を明らかにしているように 思えたが、データを注意深く解析してみると、患者群はほとんどすべて社会経済的下層から、対 照群はほとんどすべて上流から出ていたことがわかった。これはつまり、患者群と対照群とが比 較できないことを意味した。
一九九〇年初頭イエール人学メディカルスクールのアル'ハン*ファインシュタイン(>ygjl Feinstein)とラルフ.ホルヴィッツ(RalfHorvitz)は、確実に患者群と対照群が釣り合うため に、このような研究を行う際の非常に厳しいルールを提案した。ファインシュタイン=ホルヴィ ッツのルールを、これらの後向きケース.コントロールによるがんと喫煙に関する研究に適用す ると、すべて失敗となる。
別のアプローチは「前向き研究(prospective study)」である。この種の研究では、対象者群 は前もってわかっている。彼らの喫煙歴が注意深く記録され'どんな病気が起こるかが追跡調査 される。一九五八年までに、ー;|つの独自な前向き研究が行われた。|つめは、イギリスの五万人 の内科医を対象に実施された(これも同じく後向き研究を最初に手がけたヒルとドールによる)。 実際のところ、ヒルとドールの研究ではさほど長期にわたって被験者を追跡しなかった。その代 わりに、喫煙をはじめとする健康習慣の聞き取り調査をし、五年ものあいだ観察することになっ た。というのも、被験者の多くが肺がんに罹り始めたからだった。
さて、その研究結果は、ある関係を示唆する以上のことをもたらした。喫煙量の違いによって 被験者をグループ分けすることができたのである。タバコを吸う量が多いE1師ほど肺がんに罹る 確率がより高くなっていた。これはまさに用量反応関係(doseresponse)であり、薬理学では 結果の重要な裏づけとなる。
二つめは、アメリカでハモンド(Hammond)とホーン(Horn)が、一八万七七八三人の男性 を対象に四力月にわたる前向き調?を実施し、彼らもまた用量反応関係を認めた(一九五八年に 雑誌掲載)。
しかしながら、前向き研究にはいくつかの問題もある。もしもその研究規模が小さいなら、あ る特定の母集団を扱っているのかもしれないので、その結果を大きな母集_に当てはめて外?し ようとしても意味がないかもしれないのである。たとえば、これらの初期の前]&]き研究のほとん どは、対象者を男性に絞っていた。当時、女性の肺がんの発生率が低すぎて解析することができ なかったのである。
1則向き研究のニ番目の問題は、目的にかなった解析を行うために、起こるべき事象(肺がん) を十分に得るにはとても時間がかかるということだ。これらの問題はともに、数多くの人を追跡 することで対処されている"数が多いということは、その結果が大きな母集団に対しても成り立 つという示唆に信用を与えることになる。事象の確率が短期間では低くても、多人数を追跡する ことによつて解析に耐え、.っる十分な事象を得ることができるたろ、っ。
ドールとヒルによる二番gの研究は内科医を対象に行われたが、それは喫煙習慣に対する医師
の記憶力は当てにできると信じられていたからであり、また医師という職業に対する彼らの帰属 意識によってそのグループ内に生じた肺がんが余すところなく記録されるだろうと確信されてい たからである。高度な教育を受けた専門職である医師から得られた結果を、高校レベルの教育を 受けていない労働者に対しても同じく推測してかまわないものだろうか。正確な情報が少なくな るという危険を胃してでも、標本が典型的なものとなることを期待して、ハモンドとホ}ンはほ ぼニ〇万人の男性を対象にした。ここで読者は、対象が便宜標本であることから、データ標本に 対する力?ル.ピアソンの反論を思い出すかもしれない。これらもまた便宜標本だつたのではな いだろうか。
三つめの研究は一九五八年、その反論に答えるために、.H . F .ドーン(H.Fborn)が三大都 市の死亡証明書を調べ、遺族のィンタビューをつけ加えたものだ。これはすべての死を扱ったも のであるため、便宜標本と考えることはできない。この研究でもまた、喫煙と肺がんの関係は圧 倒的に深かった。
ところが、遺族へのィンタビューに問題があったという議論が起こってもおかしくなかった。 というのも、この研究が行われるころには、肺がんと喫煙の関係は広く知れ渡っていたからであ る。肺がんで亡くなった患者の遺族は、本人が喫煙者だったことを他の病気で亡くなった遺族よ りもよく覚えている可能性が大きかったのだ。
このように、たいていの研究は疫学的研究と結びついているのである。各研究はどうかすると 難をつけられる。批評家は各研究の結論に偏りがあるかもしれないと指摘できるからだ。
nlンフイールドと共著者たちは、一九五八年より前に異なる国々で異なる母集■に対して実 施された三oもの疫学的研究をまとめた"彼らが指摘しているように、これら多くの研究^Iあ らゆる種類の研究?h.を貫く高い整合性が、最終結論に対する信頼性を高めているのだ。彼らは 反論を一つずつ議論した。まず、バークソンの反論を議論し、一つか一:つほどの検討によって、 そのような反論にどう取り組むべきか明らかにしている"ネイマンは、もしも喫煙患者が非喫煙 患者よりも長生きして肺がんが加齢による病気ならば、最初の後向き研究は偏りがあることを示 唆した。コーンフイールドらは研究で用いた患者のデータを公表しネイマンの示唆かこれら の患者を適切に記述していないことを証明した。
また彼らは、便宜標本が非代表的であるか否かの疑問に対して二通りの方法で対処した。
一つめは、標本に含まれる患者の範囲を広げると、結論が成り立つていると仮定したときのも つともらしさが増すことを示した。
ニつめは、もしも因果関係が基本的な生物学の結果として成り立つならば、患者の異なる社会 経済的かつ人種的な背景は関係なくなるだろうと指摘した"さらに、毒理学の研究も再検討し、 動物実験と組織培養からタバコの煙による発がん効果を認めた"
コーンフイールドらによる一連の論文は、原因疫学的研究においてどのように証明されるかの 一つの典型的な例となっている。各研究には欠点もあるが、次から次に行われる研究が同じ結論 を補強しながら、証拠が蓄積されつづけているのである。
喫煙とがん対枯葉剤
これとは対照的なものに、ベトナム戦争の退役軍人がのちにこうむった健康上の問題がある。 健康を害した一原因としてオレンジ剤を起訴しようとした試みだ。健康被害の原因と見なされて いる薬剤は' 除草剤として使われていたものに含まれる汚染物質である。おおかたの研究が、そ の除草剤に異なる方法でさらされたいく人かの同数の男性を対象としていた。他の母集団におけ る研究では、これらの知見は支持されなかった。一九七〇年代には、イタリア北部の化学工場の 事故で、長期的な影響はないが、きわめて高レべルの汚染物質に大勢の人々がさらされることに なった。ニユージーランドの芝生産農家で除草剤にさらされた労働者の研究では、ある特定の出 生異常の増加が:不唆されたが、その労働者の大半がマオリ族で、彼らはその出生異常の遺伝的な 傾向を有していた。
喫煙と枯葉剤研究におけるもう一つの違いは、喫煙によって推定される結論がかなり特定.(肺 の類表皮がん)されている点である。一方、枯葉剤晒曝によって引き起こされたと思われる事象 は、かなり広範囲の神経性および生殖問題とを有していた。これは、特定の薬剤は特定の障害を 引き起こすという毒理学の通常の知見に反するものだ。枯葉剤研究では、用S反応関係のデータ はないが、薬剤にさらされた個体に対してそれぞれの用:aを決めるためのデー夕は不十分ながら ある。その結論はわかりにくく、バークソン、ネイマン' フイッシャーらのような反論を避けて
おかねばならない。
ここまで疫学的研究の解析を通じて、バートランド.ラッセルの非常にはっきりとした正確さ と実質含意とによる長い道のりをたどってきた"今や人間を対象にした多くの研究での失敗が、 因果関係に帰着されている。この関係は統計的なもので、分亦の母数を変えれば特定の原因に関 連しているかのように見えてしまうのだ。分別ある観測者に期待されているのは、多くの欠陥の ある研究をまとめ、根底に横たわる共通の道筋を見つけることなのである。
公表の偏り
もし、そういった研究が取捨選択されているとしたらどうなるだろうか。観測者が利用できる 研究の全集合が、実際に行われた研究のなかで注意深く選り抜かれた部分集合だったとしたらど うなるだろう。肯定的な研究すベてが公になるのに対し、否定的な研究がひた隠しされていると したらどうなるだろうか。
結局、すべての研究が公表されるわけではないのである。調渣者がその仕事を仕上げられなか ったり仕上げるつもりがなかったりして書き上げられない研究もあれば、雑誌の基準に合わない という理由で編集者によって封下される研究もあるだろう。往々にしてあるテ^ ?マをめぐっ て論争があるときには、編集者は学界に受け入れられるものを公表しようとするし、そうでない ものを公表しようとはしないものなのた。
こうした事実はフイッシャーによる非難の対象の一つであった。ヒルとドールによる最初の仕 事は、都合のよいような修正が加えられていたとフイッシャーは主張し、結論を裏づける詳細な データを二人に公表するよう数年にわたって言いつづけた。ところが、ヒルとドールはデ^ ?タの 要約だけしか公表しなかった。しかしフイッシャーは、これらの要約が実際のデー夕にあった不 一致性を隠していることをほのめかした。そしてこの研究で二人が、喫煙患者にタバコを肺まで 吸い込むかどうかを尋ねていたことを指摘したのである。
データを?|肺まで吸い込む」と「肺まで吸い込まない」という項目に振り分けると肺まで吸 い込まない患者は、(喫煙に関連した)肺がん研究にとって余分な標本となり、一方、肺まで吸 い込む患者は(余分な標本のおかげで喫煙者全体で計算されれば)あまり肺がんにならないよう に見えてしまう。これに対してヒルとドールは、これはたぶん回答者のほうが質問内容を理解し ていなかったためだろうと主張した。フイッシャーは二人の主張を鼻で笑い、彼らの研究におけ る本当の結論??喫煙は身体に害を及ぼすが、もし喫煙するならば、肺まで吸い込まないよりも 肺まで吸い込んだほうがよい??をなぜ公表しなかったのかと問いただした。
フイッシャIがつくづくうんざりしたのは、ヒルとドールが内科医を対象にした前向き研究を したとき、この質問を検討対象から外していたことだった。それ以外に注意深く取捨選択された ことは何か?フイッシャーは知りたかった。政府がその力と金にものを言わせて大衆にくり返 し恐怖心を抱かせようとしていることに、彼はぞっとした。というのも、世論を操作するために ナチスが行ったプロパガンダとなんら変わりがない、と考えたからだった。
フイッシヤ^~の答え
フイッシヤーもまた、バートランド.ラッセルによる因果関係の議論に影響されていた。彼は、 実質含意がたいていの科学的結論を記述するのにふさわしくないと認めていた。帰納的推論の性 質について詳細に書き記し、ある調査研究が優れた実験剖画の原則にしたがって行われたならば' それに基づいて世間一般の事柄に結論を下すことができると提案した。実験対象に処理をランダ ムに割りつけた実験計画法の手法は、帰納的推測に対して論理的かつ数学的に強固な基礎を与え ることを彼は示した。
疫学者は、推定や有意性検{疋におけるフイッシヤーの手法と同様に' 自分たちが計画した実験 の解析のためにフイッシヤーが開発した道具を使っていた。しかしその実態は、これらの道具を 便宜標本に当てはめ、その際の処置の割付を、その研究とは無関係のランダムな機構によって行 うのではなく、研究それ自体と複雑に関連した部分として行っていたのである。
フイッシヤーは次のように思索した。ある人は喫煙者に、その他の人は非喫煙者になるような、 何か遺伝的なものがあると仮定してみよう。さらにこの同じ遺伝的な配列が肺がんの出現.も左右 すると考えてみよう。周知のことだが、多くのがんは家系的な要因を含んでいる。喫煙と肺がん との密接な関係は、それぞれ同じ事象、すなわち同じ遺伝的な配列によって存在すると仮定して みよう。フイッシヤーはこのことを証明するために 一卵性双生児のテータを集めた。そして双
子がともに喫煙者になるか非喫煙者になるかには強い家族的傾向があることを突き止めた。それ 以外にも、肺がんが同じように遺伝的な影響を受けないことを示そうとしていた。
一方には、統計的分布の全体理論を数学的にしっかりと基礎づけた癇癩持ちの天才フイッシャ 1が、最後の戦いをしていた。他方には、正規の教育では歴史学の学士号しか持たないが独力で 統計学を学び、新しい重要な統計景をつくるのに忙しくて修士号や博士号をとることができなか
つたシエリー.コーンフイ-?.ルドがいた。
ランダムな実験計画法なしには何も証明することができない、とフイッシャーは言った。実験 計画をする必要のないものもあるが、それよりも証拠の蓄積によって罹患の場合が証明されるべ きである、とコーンフイールドは言つた。両人ともすでに亡くなつているが彼らが遺した知的 な宝物は今もわれわれとともにある。これらの議論は法廷内にも響き渡り、結論に基づいて識別 を証明する試みが実施されたり、(地球の)生物圏での人間活動による有害な結果を同定するた めの試みとして重要な役割を果たしている。生死をめぐる大問題が医学界に起こるたびに、こう いつた議論がなされている。結局のところ、因果関係を証明するのはそんなにたやすいことでは ないのである。
一九:::一一年の夏の終わりに、ジョージ*w■スネデ力ー(Georgew.snedecor)はケンタツキ 1大学をあとにして、スーツケースにわずかな荷物を詰め込み、アイオワ大学に向かって車を走 らせた。そこで数学を教える就職口があることを人づてに聞いたのである。不幸なことに、彼は アイオワの地理にうとかったので、アイオワ大学のあるアイオワシティではなく、アイオワ州立 大学のあるアイオワ州エームズに行つてしまった。
「違うょ、数学者なんか募集していないょ」。いったんはこう一:一一Eわれたのだが、アイオワ州立大 学は数学的基礎のできていない学生を多く抱えていた。
「では、代数学の授業を教えてくれないだろうか」
その六年後、彼は統計的手法の新しいアイデアの譁義を用意すべきであると学部を説得した。
そうこ、っして、フィツシャーの農業実験に関する最初の論文が発表され始めたころ、彼は所属し ていた農学部で統計学の考え方に慣れ親しんでいったのだった。
スネデ力ー自身は数学科で確率論の授業を受けていなかったが、エームズに腰を落ち着けてこ れらの新しい発展を研究し、統計の研究室をつくった。そして、アメリカで最初の学術的な学科 として統計学科を創設した。彼はフィッシャーの論文を研究し、その後ピアソン、「ステユ?デ ントJ、エッシワース、イエーツ、フォン■ミーゼスらの研究を概説するようになった。スネデ カーはオリジナルな研究にあまり貢献しなかったが、統合に秀でた人であった。I九三?年代に 『統計的方法(statistical Methods)』というテキストを著した。^初はガリ版刷りだったのが, 一九四o年にはついに出版されて、その分野で卓越した一冊となった"フィッシャーの著書『研 究者のための統計的方法』を改良して基本的な数学的導出を追加し、似たような概念を一括りに し、最小の努力でP値や信頼区間が計算しやすいように数表を拡張した。一九七〇年代には、科 学全分野の科学論文で、スネデカーの『統計的方法』が最も引用される本となった。
スネデカーはまた、有能な管理者でもあった。彼は統計科学の優れた人物を招き、エームズで の夏.を過ごしてもらった。一九二?年代の大半、フィッシャーは自らエームズにやって来ては数 週間滞在し、講演やコンサルティングなどを行った。アイオワ州エームズにある統計研究所と統 計学科は、世界の統計研究の最も重要な拠点の一つになった。第二次大戦前の数年間で、エーム ズに訪れた客員教授のリストはそのままこの分野における著名人の名簿になった。
ガートルード.コックス(Gertmdecox)がアイオワ州立大学に勉強するためにやって来たの
は、ちようどこのころである。彼女は宣教師になって遠い国で魂を救済したいという夢を持って いた。高校を卒業してからほぼ七年間、メソジスト教会で慈善活動に専念していた。だが宣教師 になるためには大学教育を受けなくてはならな力った。ところかスネテ力ーか宜教師よりも 統計学のおもしろさに彼女を目覚めさせてしまい、卒業後、彼女は統計研究所でスネデカーとと もに研究をするためにこの地に残った。
一九一:ニ年、彼女はアイォワ州立大学から統計学の最初の修士号を授与され、スネデ力ーに雇 われて彼の学部で教えるようになった。特に実験計画におけるフイッシャーの理論に興味を持ち、 エームズで初となる実験計画の授業を行った。スネデカーはカリフォルニア大学の心理学博士課 程に彼女を行かせたので、さらにニ年間' 勉強を続けることになった"博士号を持ってエームズ に戻ると、スネデカーは統計研究所を彼女に任せた。
とかくするうち、優れた統計学者たちがぞくぞくとエームズに立ち寄るようになっていった。 ウイリアム.コクラン(wieamcochran)は教授職を得て' しばらくエームズにとどまった。 彼はガートルード.コックスに同調して実験計画の授業を行った(当時、すでに多.くの講義が開 設されていた)。
一九五〇年には、ニ人は共著でテキスト『実験計画法(£^7503.7%§?£65^-さ5)』を書いた。 スネデ力ーの『統計的方法』と同じく、コクランとコックスの『実験計画法』は' その背景にあ る数学のしっかりとしたR礎づけによる手法を読者に提供している。またこの本は、実験者が特 定の状況に応じて計画を修正したり結果を解析したりするのに非常に役に立つ表を多数つけてい
た。科学引用索引誌(5s.fmceca-a??.0Tt!nde!iは毎年、科学雑誌のなかで引用された文献を抽 出し、そのリストを発表している。そこでは、五段にわたって引用文献のリス卜が小さな活字で N描されているかコクランとコックスの本を弓用した文献は毎年少なくとも一段を全部埋める ほどである。
女性の貢献
読者はたぶん気づいているだろうが、本書でこれまでに登場した統計学者は、フローレンスナイチンゲー ル. デイヴイッドを除いて、 すべて男性である。 統計学の揺籃期は男性がその大半 を占めていたのである。多くの女性がこの分野で働いていたが、たいていは統計解析に必要な詳 細な計奪.をするために雇われているにすぎず、実のところ「計算機」と呼ばれていた。大がかり な計算をしなければならないので手動式計算機の助けを借りていたが、この退屈で単調な仕事は おおかた女性に任されていた。女性のほうが従順で根気があり、それは信念へと変わって、計算 のチェックや再チェックをするのに男性以上に頼られるまでになった。力ール-ピアソンのゴー ルトン生物測定研究所での典型的な姿は、ピアソンと数人の男性がアイデアを多角的に検討した り、コンビユータからの出力を眺めたり、深遠なる数学的アイデアを議論したりする一方で、横 に一列に並んだ女性たちが計算をしている、というものだった。
ニo世紀が進むなかで、状況が変わり始めた。イェジ 不イマンは、とりわけ多.くの女性を
助け励ましたり、彼女たちが博士号を取得するために指導したり、I緒に論文を発表したり、学 界のなかで彼女たちのために職場を見つけたりもした。一九九〇年代、私が統計学の学会の全国 大会に参加したときには、参加者の半数が女性だった。
女性の存在は、アメリカ統計学会、計量生物学会、王立統計学会、そして数理統計学会におい て顕著である。ところが、女性の学会での発表の機会は、いまだ男性と同等ではない。統計雑誌 に掲載される論文のうち、女性執筆者もしくは共著者の一人が女性である論文はおょそ::■::;〇%だ が、アメリカ統計学会でフヱローを称されている女性はI三%にすぎない。
しかし、この不均衡は変わりつつある。ニ〇世紀の終わりの数年で、人類の半数を占める女性 が偉大な数学的活動ができることを証明した"
一九四〇年、ショーシ.スネデカーが、ノースカロライナ大学学長のフランク■グラハム (FrankGraham)に電車でたまたま出会ったときは、まだそういった状況ではなかった。二人は 一緒に座り、いろんなことを話し合った。グラハムは統計革命のことを聞きかじっていたので' スネデ力ーは統計的モデルを使った農業や化学の研究における著しい進展についての最新情報を グラハムに教えた。グラハムは、アメリカで充実した統計学科がアイオワ州立大学だけにしかな いことを知って驚いた。プリンストン大学ではサミュエル.ウィルクス(samual Wilks)がー群 の数理統計学者を育てていたが、これは数学科のなかでのことだった。似たょうな状況はヘンリ 1■力ーヴァー (Henry carver)のいたミシガン大学でもあった。グラハムはこの電車で得た 情報についてあれこれと考えをめぐらした。
それから数週間が過ぎ、グラハムはスネデヵーに連絡をとった。彼は、統計研究室を立ち上げ、 最終的にはアィオワ州立大学のような統計学科創設をめざす絶好の機会だと言って、ローリjに ある姉妹校のノースヵ口ラィナ州立大学を説得していた。ひいては、スネデ力ーにその学科創設 に向けてリーダーとなる人を推薦してほしいと頼んだ。スネデヵーは机に向かって座り、適任だ と思われる男性を苦労してリストアップしガjトルjド.コックスを呼んで、リストをチェッ クして彼女の考えを述べるように言った。彼女はざっと目を通してから「私ではどうでしよう か?」と尋ねた。彼は手紙に一行つけ加えた。「これらは私の考える一?人の最適と思われる男 性(thetenbestmeloです。しかし、もしもあなたが最高の人(thebestperson)を求めるので あれば、私はガートルード.コックスを推薦します」
ガ1-ルード■コックスは優秀な実験科学者であり、すばらしい教師であると同時に、優れた 管理者でもあった。教師としても優れている有名な統計学者を集めて学科を設立したのである。 教え子たちは、産業界、学界、政界で主要な地位に就くようになった。彼女は学生たちの敬意と 親愛の的だった。
私が初めて彼女に出会ったのはアメリヵ統計学会の会合でのことで、ふと気がつくと、小さく てもの静かなお年を召した女性が向かいの席に座っていた。彼女が話すとき、それが理論であれ 応用であれ、話題に熱中するにつれて彼女のHはきらきらと輝いた。コメントはとても愉快で、 控えめながら機知に富んでいた。そのとき彼女が白血病に皆されていて、すでに余命いくばくも ないことを知らなかった。彼女が亡くなってから数年後、毎年夏に開かれる複数の統計関連学会
の伝統的な連合大会で彼女の教え子たちが集まり、彼女に敬意を表してロードレースを主催し、 彼女の名にちなんだ奨学金の資金調達をするよぅになっている。
コックスの応用統計学科がとても成功を収めていたので、フランク'グラハムは、一九四六年 までにチャペルヒルにあるノースカロライナ大学に数R統計学科を、その後すぐに生物統計学科 を創設することができた。ノースカロライナ仲立大学、ノースカロライナ大学、そしてデューク 大W,子による「三角地帯(リサーチ*トライアングル)」は、統計研究の中心地となり、それらの 大学から専門家を招んできて株式非公開の研究会社が数多く生まれた。コックスの働きぶりによ って、彼女の恩師ジョージ-スネデ力ーの業績がかすんでしまった"
経済指標の発達
女性がアメリカ政府の統計部門で|1要な役割を果たすよぅになると、センサス局、労働統計屈、 全国保健統計センター、行政管理予算局などの幹部クラスの職にその多くが就くよぅになった。 その最たるー人ジャネット.ノーゥッド(レ31&11^<:0^00&.は、^働統計周の局長にまで昇りつ め、一九九一年に引退した。
ノ 一ゥッドは、アメリカが第二次大戦に突入したとき、ニュージャーシー仲ニュープランズゥ イックにあるラトガ1'ス大学のダグラス女子太に通っていた'恋人のハーナード.ノーゥッド (Bernard Norwood)は戦争に行くことになつていたので、二人は結婚することに決めた。彼女
労働統計局長当時のジャネット■ノーウッド(右)
は一九歳、彼は:;〇歳だった。彼はすぐに戦地に赴くわけではなかったので、一一人は一緒に過ご すことができた。
しかしこの結婚は、ダグラス大学の保守的な世界では問題となった。それまで学生結婚など前 例がなかったからである。男性訪問者に関するルールがジャネットとその夫にも適用されるのだ ろうか。彼女がキャンパスを出てニユーョークの彼のもとへと行くのに、両親の許可が必要だろ. うか。
この先例をつくるという経験は、このさきジャネット.ノーゥッドについて固ることになる。 一九四九年にタフツ大学から博士号を授与されたときも、彼女が今までで一番若い授与者だった。 「節0節目で、私は自分が活動してきた組織のなかで高い地位を与えられた最初の女性であった」 と彼女は書いている。彼女は労働統計局で初の女性局長となり、一九七九年から九一年までその 地位にいた。
労働統計局は、一九七九年に自分たちがこのポストに任命した人物について何もわかっていな かったのかもしれない。ノ ?ゥッドが局長になる前は、労働省の政策部門の代表が当局によって 予定された全プレスリリースの検討に陪席するという慣習があったが、ノーゥッドはその代表に もう会議に来なくていいと告げた。当局によって発表された経済情報は正確で政党色のないもの であるだけでなく、実際そうなるように結果が現れるものであるべきだと、彼女は信じていた。 当局のあらゆる活動が、政治的影響のかけらもない、完全に分離したものであることを望んでい たのだ。
問題が非常に重要ならば、あなたがたは原則として、辞任も厭わないという姿勢をはっき り示すことが大切だとわかった。……政府内で、あなたがたは主張を通すことのできる独立
性を持っている。 政府内での独立性を完遂するのは容易ではない"たとえば、アメリヵ
大統領の誤りを正さなければならない状況で、あなたがたはどう対処するだろうか。われわ れはそれを実行したのである。
ジャネットとその夫は経済学で博士号を授与された。結婚してからの数年間、特に夫がョーロ ッバ共同市場の設立に関わっていたあいだ、彼女は家を空けて働こうとはせず、::.:人の息子を育 てながら研究活動を続けるべく論文を書いて過ごした"家族がワシントンDCに引っ越して、下 の息子が小学校に入ると、ジャネットは、息子が学校から帰ったとき家にいられるように、午後 の数時間、もしくは午後いっぱいが自由になるような勤め先を探した。労働統計局にうってつけ の職が見つかり、彼女は一週間のうちの三H間、午後が自由になるように勤務時間を調整するこ とができた。
労働統計局は労働省でも規模の小さい部署で' 労働省自体めったに世間で取り沙汰されること もない行政機関の一つにすぎなかった。ホワィトハゥスや国務省の刺激に比べて、この日の当た らない部局で何が行われているのだろうか。ところがこの部局は行政とい、っ機関のなかのちっぽ けだが必要不可欠なipl車なのである。政府は情報に棊づいて行動しなくてはならない.。ニユーデ
ィール政策を支持してワシントンにやって来た有望な若者たちはまもなく、国の経済状況につい て本質的な情報なしに政策は実行され得ないことを痛感したが、その必要不可欠な情報が入手で きなかった。ニユーディール政策の重要な革新は、この情報を取り出すのに必要な機関を設立す ることから成り立つていた。
こぅいった情報を得るために、労働統計局は必要な調喪を行ったり、センサス局などの他の局 から得られたデータを解析したりする"ジャネットは一九六n一年に労働統計局に加わった。一九 七〇年ごろには、消費者物価指数(CPI)を任されるまでに昇進した。CPIは、社会保障費 を物価にスライドさせ、インフレを追跡し、連邦政府から州政府への移転支出の大半を調整する ために使われる。一九七八年に、労働統計局はCPIの大がかりな見直しに着手したが、ジャネ ットはその計画を組み' 監督を行った。
ジャネットが局長を務めたあいだに当局がつくったCPIやそのほかの指数は、複雑な数学的 モデルを含んでいた。そのモデルには比較的わかりにくい母数があり、計量経済学的モデルとし ては合理的ではあるものの経済の数学的側面に不慣れな人に説明するのが難しかった。
CPIは、たとえばインフレ率が先月〇■ニ%上昇したなどといぅかたちで、よく新聞に引用 される。CPェは、いろいろな数値を複雑に;IE算したもので、経済の異なるセクターをまたぐ価 格変化やさまざまな地域の恨格変化を示している。もともと賈い物ヵこの概念から始まったもの で、典型的な家庭が日常購入するモノとサービスを表している"買い物かごに何を入れるか組み 合わせる前に標本調査が行われさまざまな家庭が何をどれくらい購入するかを判断する。一
般の家庭は毎週パンを買うが、車は数年に一回で、家はめったに買わないことを考慮に入れて、 数学的重みづけが計算される。
いったん買い物かごとそれに伴う数学的重みづけが組み合わされると、そのリストにある項目 の現在価格を記録するため、局の職員たちはランダムに選ばれた小売店に派遣される。記録され た価格は数学的重みづけの定式によって結合され、一つの総合的な数字が算出される。ある意味 で、それは想定された家族構成におけるその月の平均的な生活費である。
考え方として、ある経済活動の平均的なハターンを表す指数のアィデアを理解するのは,咎易な ことである。だが逆に、そのような指数を構築しようとするのは難しい。どうやって(パーソナ ル■コンピユータのような)新製品の出現を考慮すればいいのか。どうやって消費者が高価でも (サワークリームの代わりにョーグルトのような)ほかの類似製品を選ぶ可能性を説明すればい いのか。CFIや国民経済の健全さを測るそのほかの指標は、常に再検討されている。ジャネッ トはCFIの前回の大がかりな見直しを監督したが、このさきはほかの人がそれをすることにな るだろう。
CPIだけが国民経済の健全さを示す唯一の指数ではない。ほかにも生産活動、在庫、そして 雇用パターンを把掘するためにつくられた指数がある。また、服役人口の推計など、すべての母 数が他の非経済活動としか結びついていないような社会指標もある。確かにこれらは、力ール. ピアソンの意味での母数には違いない。それらは確率分布や数学的モデルの一部であり、それら の母数は特定の観測用能な事象を記逮しないが、そういった事象を左右する「もの」である。
このように、月ごとの生活費がCPIと完全に一致するようなアメリヵの家庭は存在しないし、 刻々と変わる失業者数の本aの数字を失業率によって表すことはできない。さらに言えば、誰が いったい「失業」していることになるのか。今まで一度も雇われたことがなく'今も職探しをし ていない人のことなのだろうか。次から次へと仕事を変え、五週間勤めては辞めるたびに退職手 当をもらっている人のことなのだろうか。一週間にたった数時間の仕事を探している人のことな のだろうか。経済モデルの世界は、そのような質問にはいかようにも答えられるし、また正確に は観測できないが相互に影響し合っているような多数の母数を含んでいるのである。
経済■社会指標の導出において、最適な基準を確立することのできるフィッシャーのような天 才はまだ現れていない"いずれにしても、人々のあいだの複雑な相互作用を少数の数値に縮約し ようと努力が続けられている。どこかで折り合いをつけ、決定を下さなければならない。アメリ 力初の失業者調杏では' 世帯主(たいていは男性)だけが数えられた。現在では前月に仕亊を探 した人は誰であれ失業者としてヵゥントしている。CPIの大がかりな見直しを監督したジャネ ットは、同様に、あるものを{疋義する際にさまざまな意見を調停しなければならなかつた。これ らの定義に反対する強硬な批判者は常にいるものなのだ。
統計学理論における女性
この章で登場した一一人の女性、ガートルード?コックスとジャネット■ノ ?ゥッドは本来、管
理者であり教師であ0た。11〇世紀の後半には女性は統計学理論の発達にも重要な役割を果たし た。第6章で紹介したL ■ H . c -ティペットの、「W年に一度の洪水」を予測するのに使われ た極値の最初の漸近分布を思い出してほしい"「ワイブル分布」として知られた、この分布のあ るバージョンは航空宇宙産業で重宝されている。ワイブル分布の一つの問題は、フイッシャーの 正則条件に合致しないことであり、そのため母数を推定する際に明確かつ最適な方法がないこと である。少なくとも、ノース,アメリカン■ロックウェル社のナンシー■マン(Nancy Malm) が、ワイブル分布ともっと簡単な分布との連結を発見し、今日その領域で使われているょぅな手 法を開発するまでは、最適な方法はなかったのである。
ウイスコンシン大学のグレース-ワーバ(Grace wahba)は、「スプライン当てはめ」と呼ば れる曲線^てはめのその場限りの手法を用いて、現在、スプラインの統計解析で主流となった理 論的基礎を発見した。
イボンヌ■ビショップ(Yvonne Bishop)は統計学者と医学者から成る委員会のメンバ?の一 人で、一九六o年代終わりに、それまで広く使われていた吸入麻酔薬ハロタンが患者の肝障害増 加の原因なのかどぅかを調査していた。データの多.くが事象の計数形式だったため、その解析は 難しかった。このハロタン研究の過去一〇年間は、計数の複雑な多次元集計表の処理に費やされ たが、これといって成功した者は誰もいなかった。それまでの研究者は、フイッシャーの分散分 析と似たやり方で集計表に取り組んではみたものの、未完成のままだった。ビショップはそれに とりかかり、推定と解釈に関する遊準をつくりながら理論的結果を検討した。そして、ハロタン
研究の手法を磨き上げると、それに関する権威のあるテキストを出版した"この手法は「対数線 形モデル」と呼ばれるょぅになり、今や、社会学研究の大半でまず初めに行ぅ統計解析の定#と なつている。
スネデヵーとコックスの時代からずつと、「最高の人(thebestperson)」はしばしば女性だつ たのである。
一九二〇年代後半に、サミュエル+S.ゥイルクス(siuels.wilks)がテキサスで農業を営 む家族のもとを去ってアイオワ大学に入学したころ、数学の研究は美しい杣象化のレべルを競い 合っていた"大学では記号論理学、集合論、点集合論的位相学、超限数理論といった純粋な抽象 領域が急速に広がっていた。抽象レベルが相当に高いため、これらの領域にきっかけとなるアイ デアをもたらすかもしれない現実問題からのインスピレーションも絶えて久しかった。
数学者たちは古代ギリシャのユークリッドにまでさかのぼり、彼が明らかにした数学の基礎と なる公理の研究にあわててとりかかった。そして、公理の背後にある?黙の仮定を見つけだした" 数学者たちは、数学をそぅいった仮定でもってきれいに磨き、論理的思考の抜本的な基本原則を 探し、空間充填曲線とニ次元形状がいたるところで接触するが同時には接触しないといった、ー
第紗章ただ、M朴なテキサス農煬ボーイとしT
見、自己矛盾した驚くべき概念を明らかにした。そして、無限の異なる位数や分数次元の「空 間」も調べた"数学は、現実の感覚から完全に切り離され、純然たる抽象思考の高波にすっかり 飲み込まれた。
アメリカの大学の数学科ほど、実用を越えて抽象へと飛び込んだところはなかった。アメリカ 数学会の出版物は、世界の数学雑誌のトップレベルに位置するとaなされており、アメリカの数 学者たちは杣象を越えた抽象の新しい開拓領域を椎し広げていた。サミュエル■ゥイルクスが数 年後に嘆いたょうに' これらの学科は、理論的な思考のための絶好の場を提供するという誘惑の 言葉で、アメリカの大学院生から優秀な頭脳を搾り取っていた。
アイオワ大学数学科大学院の一年^のとき、ゥイルクスは数学科で最も著名な教授?.1.ム 1ア(R.LMOOre)に教わった。ム!ア教授は点集合論的位相学の講義のなかで、この非実用的 な抽象のすばらしい世界を紹介した"教授が実用的な仕事を軽蔑していたのは明らかで、応用数 学は皿を洗ったり道を掃除したりする程度のものだと主張した。このょうな態度は古代ギリシャ 時代からずっと数学を?ませてきた。
ユークリッドが貴族の息子を教えていて、ある宛理の特に美しい証明を検討していたときの話 である。ユークリツドの意気込みにもかかわらずその生徒はまっ.たく感動した様子も見せずに これがいったい何の役に立つのかと聞いた。ユークリツドは彼の奴隸を呼びつけるとこう言った。
「この子に銅貨を一枚やってくれ。彼は自分の知識で得をしなければわからないらしい」
ゥイルクスの実用志向は、アイオワ大学で博士論文のテーマを探す段になり、彼の論文指導教
狡であつたエヴェレット‘ F ■リンクイスト{Everett F.Linquist)によつてかなえられた。リン クイストは保険数学を研究していたこともあって、数理統計という新たな発展分野に興味があり、 ウィルクスにその領域から博士論文用に問題を;つ提供したのだ。
当時、少なくともアメリヵと31ロッパの大学の数学科のなかでは、数理統計学はやや異端視 されていた。フイッシャーが先鞭をつけた偉大な仕事が、./^&06'0^/1^-07'2>雲50^§-_:0/^6 Boだa?socie^o/Bdinbmy/l誌のような「風変わりな」雑誌に掲載されていたほどである。王立 統計学会誌やバイオメトリ力誌などは、やたら数字の並んだ統計表が載っているとして軽蔑され ていた"ミシガン大学のへンリー?力ーヴァーは、数理統計学論集誌という新しい雑誌を創刊し たが、その掲載基準がたいていの数学者にとってあまりにも低すぎたので無祝されてしまった。
リンクイストは、教育心理学で使われる測定方法から抽象数学的な問題を:つ取り上げ、おも しろそうではないかと言ってウイルクスに提案したのだった。ウイルクスはこの問題を解決する と博士論文に仕上げ、結果をJoumai o/tqaucas-?2.aps4£c/so§誌に発表した。
純粋数学の曲界にとって、これは大した成果ではなかった。教育心理学の領域は純粹数学のな かでもかなり関心の薄いものだった。しかし博士論文とは、研究の世界へと最初の一歩を踏み出 す試行段階であると見なされており、その論文で重要な貢献をすることが期待されるような学生 はほとんどいない。ウィルクスは大学院研究生として一年間コロンビア大学へ行った(数学で重 要となる冷たく高度な抽象領域を扱う能力を高めるよう期待されたのである)。;九一一:三年の秋、 彼はプリンストン大学に行き、数学の専任講師の職に就いた"
プリンストンでの統計学
プリンストン大学の数学科は他のアメリヵの大学と同様に、冷たく美しい抽象数-7に熱中して いた。一九三九年、高等研究所が近くにつくられ、初期のメンバーのなかには、すべての有限群 の完全一般化を開発したジョセフ.H-M*ウエダバーン(JcsephH.M,wedde'rburn)がいた。 また、非定形ベクトル解析で有名なヘルマン■ワイル(Hermannweyl)、超数学の代数を開発し たクルト■ゲーデル(Kurt Go:del)がいた。こうした面々が世界にも名を馳せる数学者を抱えて いたプリンストン大学の数学科に影響を及ぼし、なかでも突出したソロモン■レフシヱッッ (solomonLefshetz)は代数的位相幾何学という新たな抽象領域への門戸を開いた。
プリンストンでは全般に抽象数学へと向かっていたにもかかわらず、数学科の学科長がルタ ? ?アイゼンハート(Luther Eisenhart)だったことは、ウイルクスにとって幸運だった"アイ ゼンハートはあらゆる種類の数学的研究に興味を持ち、とくに若い研究者には興味のおもむくま まに研究するよう励ました。アイゼンハートがウイルクスを雇ったのもこの数理統割という新 しい領域に大きな期待を抱いていたからであった。
ウイルクスは妻を伴ってプリンストンに着くと、新たに応用数学学科をつくるという構想を追 い求めた。ウイルクスはもの静かな戦士であった。彼が醸し出すテキサス農場出身者らしい「人 なつこさ」が、みなの心をも和ませた。彼は一人ずつにあたって自分の構想に賛同する人を探し
出し、難しいゴールを達成するための活動計画を練るのに長けていた。
ウイルクスは、まだほかの人が問題を理解しようとしているあいだに、その問題の核心を把握 し、解く方法を見つけることがよくあった。猛烈に働いて、同僚にも同じだけ働くように勧めた。 プリンストンに来てすぐに' ヘンリー■力ーヴァーが始めた雑誌、数理統計学論集の編集者にな った。そして、論文の掲載基準を上げ、彼の大学院生たちを雑誌の編集作業に参加させた。ジョ ン.テユーキーが新たに学科のメンバーに加わると、当初は抽象数学に興味を持っていたテユ.1 キーを説得して統計研究に引き入れたのも彼だった。ウイルクスは第二次大戦後、多くの大学に 統計学科を新設し、そこのスタッフとなれるように、大学院生を次々と受け入れていった。
ウイルクスの最初の学位論文が教育心理学の問題についてのものだったので、Educational Testing Service RfIT^l-r^lsEfflL1Uと仕事をするようになり、大学入学や他の専門学校試験で 使われる標本手順や採点技術の定式化に一役買った。彼の理論的な仕事は、順序づけの異なる採 点法が似たような結果を生み出すというもので、これで学位を取得した。ウイルクスは、ベル研 究所のウォルター*シユーハートと交流を持った"シユーハートはフイッシャーの実験計画理論 を産業界の品質管理に適州しようとしていたのである。
統計と戦争の準備
一九四o年代に近づいたころ、ウイルクスの最も重要な仕事は、ワシントンにある海軍研究局
でのコンサルタントとしての業務になっていった。ウイルクスは実験計画手法を使えば軍事兵器 と発射原則を改良できると信じていて、海軍研究局内に自分の話に耳を傾けてくれる人を兒つけ だした。アメリカが第二次大戦に突入するまでに、陸海軍はともにアメリカ流オペレーション ズ‘リサーチに統計手法を適用するつもりでいた。ウイルクスは国防研究委貝会の下にプリンス トン統計研究グループ(SRGIP)を立ち上げ、優秀な若手の数学者や統計学者を新規に採爪 した。彼らの多くは終戦後の数年で、科学に対して多大な貢献をした。
なかには、完全に応用へと関心を向けたジョン■テユーキー、のちにハーバード大学でいくつ かの統計に関する学科を創設することになったフレデリック.モステラー、多変量解析のテキス トがその分野のバイブルとなったセオドア.W .アンダーソン(Theodore W.Anderson)、確率 過程の理論で多大な貢献をすることになるアレクサンダー.ムード(AlexanderMood)、推定手 法の講義に名前がつくことになったチヤールズ■ウインザー(Charleswinsor)らがいた。
リチヤード.アンダIソン(Richard Anderson)は、そのとき大学院生でありながらSRGI Pで働いていて、地雷破壊の方法を見つけるために行われていた試みを記録していた。rr本進攻 が近づいたころ、アメリカ陸軍は、日本が非金属の地雷を開発し、旧来のいかなる手段を用いて もこれらを探知できないことを知った。日本は、R本沿3序のあらゆる侵入可能なルートにこの地 雷をランダムに配置した。この地雷にょる死者だけで推定数十万人にのぼった ^^?。この地雷の破壊方法を?つけることは緊急課題であった"飛行機から爆弾を投ドする3 1ロッパの試みは失敗していた。アンダーソンとs R G ? Pの他のメンバーに課せられた問題は、
起爆線の束を使った地雷破壤に関する実験計画だった。アンダーソンによれば、アメリヵが日本 に原爆を投下した理由の一つは、そのような手段では地雷を破壊できないことがあらゆる実験と 計算を通じて示されたからだそうだ。
そのグループは、対空弾における近接信管の有効性に取り組んでいた。近接信管はレーダー信 号を発信し、目標に近づくと爆発する。そのグループは、目標に向かって舵取りをすることがで きるスマート爆弾の第一号の開発を手伝い、距離計とさまざまな種類の爆薬を担当した。SRG IPのメンバーは、兵器研究所や全国の陸海軍施設で実験を計画したり、デー夕を解析したりし て適所を得ていた。ゥィルクスは、コロンビア大学でプリンストン-ジュニア統計調杳グループ (SRG Ipjr)という第二グループの統括に手を貸した。そのSRG Ipjrから「逐次解 析」が生まれた。この解析は、実験の最中に実験計画を修正していく手段である。逐次解析で許 される修正は、テストされる処理そのものを含んでいる。ときに、どんなに入念な実験計画も、 結果が見えてくると、元の計画を変更してもっと完全な結果が得られるようにすべきだ、と思う ものである。逐次解析の数学のおかげで科学者は、結論の妥当性に影響を与えることなく、どん な修正がよくてどんな修正がよくないかを知ることができた。
逐次解析における初期の研究は、すぐに最高機密に指定された。そこで働いている統計学者は みんな、終戦後数年間にあいだは研究を発表することが許されなかった。一九五o年代に逐次解 析とその派生の「逐次推定」に関する最初の論文が現れるやいなや、この手法は他の研究者を魅 了して、この領域は急速に発展した。今R、統計解析における逐次手法は、産業の品質管理、医
療研究、社会学の分野で広く使われている。
この逐次解析法は、ウイルクスの統計研究グループが第二次大戦中に生み出した多くの革新の 一つにすぎない。ウイルクスは戦後も軍での仕事を続け、装置の品質管理を改良したり、統計的 手法を用いて将来の需要計画を改善したり、さらには統計的手法を軍原則のあらゆる側面に持ち 込んだ。ウイルクスが抽象理論の世界に住みつづける数学者に唱えた不服の一つは、彼らが愛国 的でないことだった。役に立たない抽象理論にせっかくの頭脳を浪費しており、国はまさにその 頭脳を必要としているとウイルクスは感じたのだ。この頭脳は、最初は戦争準備に、次に冷戦に おいて利用される必要があったのである。
ウイルクスに腹を立てたという人の記録はない。彼は、新参の大学院生であろうと四つ星の陸 軍大将であろうと、誰にでも同じょうに打ち解けた態度で接した。彼はただのテキサス農家の息 子だという風情を醸し出していたし、彼が大いに学んで知っていたことに対しても、どうなんだ ろうかと問うた。こうすることが、身近な問題に対する着実な分析だったのだろう。
統計的抽象性
ウイルクスは数理統計学を、れっきとした数学の一部門として、また応用面で役立つ道具とし て稱築しょうと懸命であった。抽象至上主義ともいえる冷たい世界から仲間の数学者たちを救い 出そうともした。確かに数学的抽象性には根本的な美しさがある。それゆえ、ギリシャ哲学者の
プラトンを惹きつけ、この世で見たり触れたりするものはすべて、実際は真の実体の単なる影に すぎず、この宇宙の真の事柄は純粋な理性によってのみ発見されることを、プラトンは宣言した のである。プラトンの数学の知識は相対的に稚拙で、ギリシャ数学の大事にされた純粋さの多く には、瑕疵があることがわかった。しかしながら、純粋な理性から発見されぅるものの美しさは 数学者を誘惑しつづけている。
ゥイルクスが数理統計学論集誌の編集者になってから数年後、数理統計学論集誌とバイオメト リヵ誌に現れる論文がだんだん抽象的になっていった。これはアメリヵ統計学会誌(Journal cf American Statistical Association ?■初期の号では官庁統計プログラムの記述で占められていた) や王立統計学会誌(初期の号ではイギリス帝国全体の詳細な農業統計や経済統計を並べた論文が あった)の論文でも同じことであった。
数理統計学の理論は、かつて数学者によって、厄介な現実問題にどっぶりはまっていると考え られていたが、不純物を取り除き、砥石で磨くと数学的美しさを持つよぅになった。アブラハ ム■ワルドは、かなり抽象的な一般概念である「決定理論」をつくることによって、推定理論研 究を統一した。決定理論では、理論的性質が興なれば推定値に対する基準も異なる。
実験計画におけるフイッシャーの研究は、有限群論からの定理を利用したし、異なる処置を比 較する際の魅力ある方法を開発した。このことから数学の一分野に「実験計画」ができたが、こ の領域で発表される論文が非常に複雑な実験を扱いがちなので、実際には科学者は誰もそれらを 使わなくなっている。
他の人がアンドレィ-nルモゴロフの初期の仕事を検討しつづけて、やがて確率空間と確率過 程の概念はさらに統合されたが、ますます抽象的になった。一九六o年代までに統計雑誌に発表 された論文は、集合の「b ?加法族(sigmafields)」による無限個の結合や交わりが定義された 無限集合、すなわちび?加法族のなかのび?加法族を扱っていた。もたらされる無限列は無限遠 点に収束し、確率過程は時間とともに状態を表す小さな有界集合を変えていくが、時間とともに いつまでも変わりつづけるようになっている。数理統計学の終末論は、いかなる宗教の終末論と 同等に複雑、もしくはそれ以上に複雑である。さらに数理統計学の結論は真実であるだけでなく、 宗教の真実とは異なり、真実と証明されうるものでもあるのだ。
一九八〇年代に数理統計学者は、自分たちの領域が真の問題からかなりかけ離れているという 現実に気づいた。応用面での喫緊の要求に答えるために、大学は生物統計学科、疫学科、応瓜統 計学科をつくり始めた。これらの試みは、ひとたび統一されたものをばらばらに分解して修正す ることだった。数理統計学会の大会は、「現実的な」問題に時間を充てるようになった。アメリ 力統計学会誌は、応用を扱うために毎号一つの欄を用意した。王立統計学会発行の三誌のうちの .一つが応用統計学04pp/ied6ベa3-.ss-.〕cs)と名づけられた。まだ抽象理論の魅力は続いていた。一 九五〇年代に設立された計量生物学会は'&:0§思7^5誌を刊行し、バィォメトリヵ誌に歓迎さ れないような応用論文を発表していこうとした。だが、一九八〇年代までに£8-77?^3.05誌はそ の.内容がかなり杣象的になったので、Statistics in Medicine誌などの雑誌もつくって応用論文. を載せたほどだった。
アメリヵとョーロッバの大学の数学科は、数理統計学がその姿を現したとき好機1的〕 を逸した。ゥイルクスの先導のもと、多くの大学では統計学科を数学科とは別につくつてしまっ たのだ。テシタル.コンヒユータか現れたときも、エ学剖算をするための単なる機械にすきない とあしらい、数学科はまたしてもチャンスを逃した。工学部と統計学科とから人が集められ、数 学科とは別にコンピユー夕.サイエンス学科が新設された。新しい数学的アイデアを含んだ次の 大きな変革は、一九八0年代の分子生物学の発展であった。第28章で見るょぅに、数学科も統計 学科もともにこの絶好の機会を逸したのである。
サミユエル-ゥイルクスはー九六四年に:.\1:八歳で亡くなった。多くの教え子たちが、逐次推定 からここ五〇年間にわたって統計学の発展に大きな役割を果たしてきている。彼の名声は、彼の 基準に合った数学的創造性と「現実社会」に貢献のあった人にS . S .ゥイルクスメダルを毎年 授与することでアメリヵ統計学会から称えられている。テキサス農場の息子は名を上げたのだっ た。
ニ0世紀の最初の四半世紀が過ぎたころ、東ヨーロッパや南ヨーロッパからィギリス、アメリ 力、オーストラリア、南アフリカへの大規模な移住が起こった。数百万人にのぼる移民の大半は、 祖国での最下層階級の出身で、経済的にょり恵まれた環境と自由を求めて圧制的な支配者や無政 府状態から逃れてきたのだった。
多くは大都市の貧民街に住み、こんな薄汚い場所から道い上がるょうに教育という魔法の杖を 使って子供たちを駆り立てた。なかには目を見張るょうな将来有望な子もいた。天才すらいた_、 これから話すのはそんな二人の移;Hの子供についてである。一人は学術博士 (Fh.D.)と二つの 理学博士 (SC.D.)を取得したが、もう一人は一四歳で高校を中退した"
第"章夭才誕生
Tx , _ 1*グッド
モ?ゼス.グダック(Moses Goodack)は、帝政ロシア皇帝や故網のポーランド領にまったく 愛着を持たなかった。特にロシア皇帝の軍隊に徴兵される気などさらさらなかった。一七歳にな ると、グダックは同じ考えを持つ友だちと一緒に西側へと逃げた。一;人の手.元にはわずか三五ル 1ブルと一つの大きなチーズだけしかなかった。鉄道の切符がなかったので、二人は汽車のシー トの下にもぐり込んで眠り、切符係をそのチーズで買収して乗り通したのである。
グダックは自分の度胸と健康な身体以外はいっさい持たずに、ロンドンにあるユダヤ人居住地 区のホワイトチャペルにたどり蒲き、そこで時計修理店を開いた。時計修理は、職人が働いてい る様子をシヨ^^ウインドウ(その明るさは見てくたさレとーー1£1わんばヵりだつた)越しに?て覚え たのだつた。彼はアンテイ--ク*カメオ〔|ド;|\2に興味を持ち、とぅとぅアンテイーク‘ジ ュエリーの専門店を大英博物館の近くに開いた(彼の未来の?.からお金を借りて0店の窓に新 しい屋号を描くのに雇われた看板屋は酔っ払っていたので、「グダック(Goodack)」の綴りを理 解できず、着板が「グッド(Good)のカメオ崖」となってしまった。それで、名字が「グッド」 となつた。
そんなモーゼス-グダックの息子としてI - J *グッドは一九一六年一二片九日にロンドンで 生まれた。彼はイシドール(Isidore)といぅ名前を授けられた。イシドール.グッドは若いころ.
「高徳ぶったイシドール」といぅ演劇の宣伝ポスターが町屮に貼られて、ばつの悪い思いをした ことがあった。このときから自らをジャックと名乗り、のちにI.J.グッドとして論文や著書 を癸表した。
一九九三年にデイヴイッド?バンクス(DavidBanks)のインタビューに答えながら、ジャッ ク.グッドは、九歳のころ、数字に慣れ親しんでいくぅちに暗算が得意になったことを思い出し た。彼はジフテリアに罹り、ベッドのなかで安静にしていなくてはならなかった。そんなとき、 姉の一人が平方根の求め方を教えてくれた。かつては平方根の求め方は、正規の授業力リキュラ ムの一環として、長い割り算の解き方を習ったあとで教えられたものだった。それは割り算に似 たやり方で、数字を区切ったりニ乘したりといった計算が紙の上で長々と続くものだった。
ベッドでおとなしく横になっていなければならなかったので、彼は頭のなかでそのニの平方根 を計算し始めた"するとこの計算が際限なく続くことに気がついた。それまでに求めた値をニ乘 してみると、その値がニにほんのわずか足りなかったのだ。出てきた数値を検討して、パターン を探しつづけたが、なかなか見つけられなかった。彼は、答えを分数で表したときに分子の二乗 と分母の二乗の二倍との差をとることがこの計算の本質であるのだとひらめいた。ゆえに、ある パターンが存在するときのみ、ニつの数の比としてこの計算を表現できるのである。
ベッドに横になって頭をフル回転させながら、一〇歳のジャック-グッドは、ニの平方根が有 理数でないことを発見した。また、この計算の途中で、「ペル(Fell)方程式」として知られる デイオファントス(Diophantine)問題の解も見つけた。ニの平方根が有理数でないことが古代
ギリシャのピタゴラス学派の連中によって発見され、ペル方程式が一六世紀に解かれていたとい う事実があるものの、一?歳の少年が暗算でこのすばらしい結果を得た価値がおとしめられるも のではない。
一九九三年のインタビューで、ジャック.グッドは感慨を込めてこう語っている。
「ハjディ(一九二〇年代から三0年代にかけて活躍したイギリスの数学者)が古代ギリシャの 数学者による偉大な業績の一つだと述べているほどだったから、悪い発見ではなかったね。さき の偉人によってすでに指摘されたことだと今となってはわかっているけど、ニ五〇〇年ものあい だ、普通の人には馴染みのない発見だったんだから」
一二歳になるとグッドは、ハムステッドにある「奉仕と服従」がモットーの男子中学校ハーバ
§
jダッシャー、ス*アスク■スクールに入?子した。そこは商店主の子弟にはもってこいのC子校で 厳格な規則を適用していた。生徒の一〇%だけが「トップフォーム」、すなわち最上級生になる ことができ、さらにその六分の一だけが大学教育を受けることができた。グッドがこの学校に入 ったころ、ミスター.スマート^というあだ名を持つ教師に教えられた。
ミスター■スマ^はよく黒板に一群の練習問題を書いた。なかにはとてつもなく難しくて学 生が解くのに時間がめっぽうかかるような問題もあったから、その時間を利用して彼は机に座っ て宰務仕事をしていた。ミスター■スマートか最後の練習問?を里〔板に書き終えたとき若きグ ッドは「できました」と言った。「それは第一問目かね?」とミスター.スマートはびっくりし て聞いた。「いいえ、全問です」とグッドは答えたのだった。
グッドは数学パズルの本に魅せられていた。まず、彼は最初に答えを見て、問題からその答え に至る方法を見つけるのを好んだ。角錘に玉を詰めるパズル問題に直面して、彼は答えを見るや いなや単調で退屈な計算によって答えにたどり着けるとわかったが、その答えを一般化する可能 性のほうに好奇心をそそられた。そうすることで、数学的帰納法の原理を発見した。グッドはだ んだん進歩していた。数学的?納法の発見は、わずか三〇〇年前の数学者によってなされたもの だったからである。
グッドは一九歳でケンブリッジ大学に入学した。数学の天才という評判がすでに広まっていた。 しかしながら、ここで彼は似たように聡明な学生が多くいることを知った。ケンブリッジ大学ジ Iザス-ヵレッジの彼の数学チユーターは、よく磨きこんで背後にある座観的なアイデアを完璧 に消し去った数学の証明を与えることに楽しみを見出していたようである。もっと難しくするた めにその証明をとても速く書いたので、学生は、彼が新しい行を書くために古い行を消してしま う前にノ1-^に書きとるのが難しいほどだった。
グッドはケンブリッジ大学で非常に優秀だったので、大学にいた数学者のHに留まっていた。
一九四一年に彼は数学の博士号を取得した。博士論文は部分次元に関するトポロジー的な概念を 扱っており、アンリ.ルべーグ(イエシー.ネイマンはルへーグの研究に敬意を表していたが、 実際に会ってみると、ルべーグはとても粗野な人物だったという、あのルべーグを思い出してほ しい)によって開発されたアイデアを拡張していた。
第二次大戦中、グッドはロンドン近郊のブレッチリーパークにある研究所で暗号解読者となっ
て、ドィッの秘密暗号を解読していた。秘密暗号とは、文書の文字を記号か数字の列に置き換え たものである。一九四〇年には、これらの暗号はかなり複雑になり、変換のバターンが文字ごと に変わるようになっていた。
たとえば、「war has begun (戦争が始まった)」というメッセージを暗号化したいとしよう。 一つの方法は各アルファペットに数字を割り当てることである。そうすると暗号文は「一2|§ 14 09IS23一一19 20 0113」となる。暗号解読者は数字のrofiJが二回現れている のに気づき、これは同じ文字のくり返しであると察しをつける。ある程度の長いメッセージと、 暗号化された元の言語における各文字の統計的出現頻度に関する知識、それに加えて少しばかり カンを働かせることによって、暗号解読者はたいていニ、三時間でそういったメッセージを解読 することができる。
ドィツは第一次大戦末期に文字ごとに暗号コードを変えるマシンを開発した。最初の文字はn 1ド「12」で暗号化されるが、次の文字を暗号化する前にそのマシンはまったく違ったnlドを 採用するので、二番DTの文字はコード「14」で暗号化されるといった具合に、次々にコードが変 わっていくのである。この方式だと暗号解読者は、同じ文字を示すような数字のくり返しに頼っ て暗号を解読することができない。暗号の受取人はこの新型のコードを理解する必要があるので. マシンが次から次へとコードを蛮.えるやり方に、ある程度の規則性がなくてはならない。そこで 暗号解読者は、統計的パターンを調べてその規則性を推定し、そのやり方で暗号を解読すること になる。だが、解読作業は非常に骨の折れるものになってしまう。というのも、ひとたび最初の
コードがある決められたプランに沿つてシフトできるとなると、そのプランをずらすプランによ つて元のプランがシフトすることが可能になるので、コードを破るのがさらに難しくなるからだ。
これらのことはすべて、第13章で述べた階層的べイズモデルに似た数学的モデルによって表す ことができる。?号化の各レべルでのシフトバターンは母数によって表される。そのため、観測 された?号化の最初の数字列、第一レベルの暗号化を記述する母数、この母数の変化を記述する 超母数、その超母数の変化を記述する超超母数などを持つことになる。結局、その暗号化された コードは受取人によって解読されることになるので、母数が固定され変わらない陪層の最終レべ ルがなくてはならず' そういった暗号コードはすべて理論的には解読可能なのである。
グッドの主な業績の一つは、ブレッチリーでの仕事から得られた経験ベイズと階層ベイズ手法 の開発への貢献だった。戦争時の経験から、数理統計学のR礎理論にたいへん興味を持った。■一 時マンチヱスター大学で教えていたが、イギリス政府は彼を情報局に呼び戻した。そこで彼は、 暗号解読の問題を扱うコンビユータの選定になくてはならない存在となった。膨大な数の可能な 組み合わせを検証するコンピユータの力を借りて、分類理論を研究することになった。その理論 は、異なる「近さ(closeness)」の定義に応じて観測データが分類されるというものである。
イギリス情報局で働きながら、グッドはケンブリッジ大学で理学博士を、オックスフォード大 学でも理学博士を取得して、計三つの学位を持つことになった。一九六七年にアメリヵに行って バージニア工科大学の上級教授となり、一九九四年に引退するまでそこにいた。
グッドは出来事にまつわる数字の明らかな符合にいつも興味をそそられた。「私がブラックス
バーグ(バージニア州)を訪れたのは、一〇年ごとの切りでいえば七番目3-(to?lKの七年目 の七月七日の七時だったし、ブロック七の七号室が私の部屋だった……すべて偶然だった」。続 けて妙なことを言った。r人々が神の存在を疑えば疑うほど、神はより偶然の一致を与えるよう になるという生半可にもならない考えを私は持っている。それによつて"神は人々に信じること を強要することなく信じる証拠を提供しているのだ」。
この偶然の一致に対する見方がきっかけとなり、彼は統計的推測理論を研究するようになった。 人間の卩は純粋な乱数にでもパターンを見ることができるので、表れたバターンはいったいどの ような点で何を意味しているのか、と彼は問うた。グッドは知性でもって、数理統計学で使われ るモデルの根底にある意味を深く探っていった。後年の彼の論文や著書はますます哲学的になっ ている。
パーシ'?■ダイアコニス
ギリシャ移民の子として一九四五^一月三一日ニューョークにiまれたパーシー?ダイアコニ ス(persiDialis)には、まったく異なる経歴が待ち受けていた。グッドと同様に若きパーシ
1も数学パズルに熱中した。グッドはH . E .デュードニj (H.E.DIIdeney) その数学パズ
ルがヴィクトリア朝時代のイギリスの人々を楽しませた??の本を読んでいたのに対して、ダイ アコニスはアメリカの科学雑誌サイエンテイフイック.アメリカン(scientific American)の.
マーティン?ガードナー(Martin Gardner)のコラム「数学?楽」を読んでいた。その後' 高校 在学中にダイアコニスはマーティン■ガードナーに会った。ガードナーのコラムはしばしば、力 hド詐欺師のトリックや目の前のものを別のものに変えるマジックなどに使われる方法を論じて いて、それらはダイアコニスの興味を惹いた。特に確率の複雑な問題があるときには。
ダイアコニスは力}ドやトリックに心を奪われてしまい' 一四歳で家を飛び出した。五歳のと きからマジック-トリックはお手の物だった"ニユーヨークで、ほかのマジシヤンが集まる店や レストランに足しげく通つた。あるカフHテリアで、マジックシヨIをしながらアメリカ中を旅 して回っていたディア.ヴアー ノン(Dia Vernon)に彼は出会った"ヴ71ノンは彼にアシスタ ントとしてマジックシmlに加わるよう誘った。「僕はそのチヤンスに飛びついたのさ」とダイ アコニスは話した。「ただ家を出ただけ。両親には何も話さなかった"ただ立ち去ったのさ」"
ヴァーノンはそのとき六〇歳であった。ダイアコニスは二年間、彼と一緒に旅をし、ヴアーノ ンのトリックや仕掛けの数々を学んだ。そうして、ヴァーノンがロサンゼルスで巡業をやめてそ の地にマジックの店を開くと、ダイアコニスは独りでマジックショーをしながら旅を続けた。彼 の名前は発音しづらかったので、甚名をパーシー.ゥォーレン^6?矣?311)に変えた。彼は 次のように語っている。
大した人生ではないけれど、オーケーだよ。キヤッツキル山地というリゾート地で働いて る。起こることなんて、誰かがあんたに会いにきて、もちろんあんたが好きで、こう言うの
さ。「なんてこった、ボストンに行こうと考えたことはないのかo- なんなら、旅費とニ
〇〇ドルを払ってやるよ」。それであんたはボストンに行って……そこで芸能業者用の下宿 屋に寝泊りをし、出演のH取りを決め、あんたがそこにいるあいだ、エージェントが次の仕 事などを持ってきたりするんだろうな、たぶん。
ニ四歳で、パーシー.ダィアコニスはマジックゲームで旅するのに飽きてニユーョークに戻っ た。彼は高校の卒業証書を持っていなかった。飛び級をしていたが、一四歳で高校を退学したと き、教育終了となるには一年ほど足りなかった。しかし、卒業証書なしに彼はニユーmlク市立 大学(CCNY)の一般教育過程に入学したのである。
家を飛び出してから一年ほど経ったとき、彼の家には軍隊や技術研修所や大学から大量の手紙. が届いていた。それらはすべて入隊や入学の勧謗の手紙で、必ず「卒業生各位」で始まっていた。 あとでわかったことだが、彼が家と学校から逃げたとき、担任の先生がとにかく彼を卒業させよ うと決心し、それまで取っていた科目に成績をつけて卒業要件を満たすようにしたのだった。若 きハーシーは何も知らないままニユーョークのジョージ*ワシントン高校の正式な卒業生になっ ていたのである。
彼は不思議な思いで大学に通った。彼は、プリンストン大学のゥィリアム.フHラーによる確 率論の大学院生向けテキストを購入していた。とてつもなく難解だった(フェラーのしっかりと 書かれた『確率論とその応用概論第一卷(7??irofiuc5r.i So proba&?7i?T^eo?一/ and ils^pp5:ca-
tions, V01.J)』を読み進めようとする人がたいていそうであったように)。ダイアコニスはフェラ 1をa解するべく正式な数学をきちんと学ぶためにCCNYに入学したのだった。一九七一年に ニ六歳で、彼はCCNYの学士号を取得した。
彼は多くの異なる大学院数学研究科から入学を許可されていた。CCNYからは誰もハーバI ド大学の数学科に行っていないことを聞いていたので(実は本当ではなかった)、ハーバード大 学の数学科ではなかったものの統計学科へ行くことに決めた。彼はハーバードに行きたかったの で、のちに語ったところによると、もしも統計学が性に合わなかったときには、「まあ、数学か 何かに転科しただろうね、むこうも僕がひどいもんだとわかるだろうからさ……」と考えていた。 どのみち、転科は確かに認められただろう。
ところが統計学は彼を惹きつけてしまった。一九七四年に彼は数理統計学で博士号を取得し、 スタンフォード大学に職を得て、のちに正教授になった。本書の執筆時点では、彼はハーバード 大学の教授である。
コンピユIタが統計解析の性質を完全に変えつつあった。まず、コンピユー夕によって、フイ ッシャーやイヱーッや他の統計学者がしていた解析と同じことを、もっと速くもっと大きな夢を 持って行えるようになった。
シェロ ?5 *コーンフイールドが24><24行列の逆行列を剖算するのにどれだけ大変だったかを 思い出してもらいたい(第17章〇今0、私の机の上にあるコンピユータはー〇〇><1〇〇行列 クラスの逆行列を計算することができる(そんな計算をしなくてはならないというのは、たぶん
問題の設定が悪いのだが)。逆行列がとれない質の悪い行列は、ー九?〇年代には単に理論上の 考えにすぎなかった一般化逆行列を計算することで処理可能となっている。巨大で複雑な分散分 析は、複数の処理と相互参照をはじめとする実験計画によって得たデー夕から計算されうる。こ の種の取り組みは、数学的モデルと一九二〇年代や三〇年代にさかのぼる統計的概念とに拠って いる。コンピュ^.タを何か違つたことに用いることかできるだろうかG
一九七?年代スタンフォード大学で、ダィアnニスは、コンビュータと数理統計学の構造を調 ベ、まさしくその疑問に答えようとする若い統計学者のグループに加わった。初期の答えの一つ は、「射影追跡法(projectionpursuit)」というデータ解析の手法であった。現代コンピュータの 呪いともいえることの|つに、巨大な次元のデータを集計できるということがある。たとえば、 心臓病になるリスクが高いと診断された一群の患者を追跡調査するとしよう。観察のために六力 月ごとにその患者を病院に速れていき、一〇cCの血液を採取し、心臓病に関連していると考え られる一〇〇種類の酵素レべルを解析する。さらに、六種類の測定値を持つ心臓Hコー図を撮り、 心?図がモニターされる(測定日にだいたい九0万回の鼓動が記録される)。そのうえ身長や体 重が測られ、打診され、臨床的徴候が調べられ、そのほかに三〇種類から四〇種類の検杳.を受け ることになる。
これら全部のデータをどうやつて扱うことかできるだろうか。
患者一人の一回の検査につき五〇〇種類もの測定値があるとすると、研究期間中に 一o?検査 を行えば五oo?種類の測定値が集まる"この研究でニ万人の対象患者がいれば、五〇〇0次元
空間にニ万点として表現されることになるのだ"たいていの科学フィクシヨンで扱われる四次元 空間ごときの旅行のことなんてこの際忘れてほしい。統計解析の現場では、数千次元の空間を扱 うのは火して珍しいことではないのである。一九:九〇年代に、リチャード■ベルマン(Kichard 38?11§11)は「次元の呪い」と呼ばれる;連の定理を生み3した。それらの定理が示しているの は、空間の次元が増えるにつれて母数のよい推定量を得るのがますます難しくなるということで ある"いったん解析者が:〇次元から二?次元以上の空間を扱うことになると、一?万個以ドの 観測値では何も決めることができなくなるのである"
ベルマンの定理は統計解析の標準的な方法論をもとにしていた"スタンフォード大学のグルー プが気づいたのは、この五〇〇〇次元空間において現実のデータが無秩序に散在しないというこ とだった。実際には低い次元にかたまりやすいのである。一一:次元上にばらまかれた点が、一つの 平而もしくは;つの直線上に杯在することを想像してみてほしい。これが実際のデータで起きる のだ"前述の臨床研究における各患者の五o〇〇個の観?値が、何かしらの構造もなく散在する ことはない"なぜなら、多くの測定値は相関関係にあるからである(プリンストン大学、ベル研 究所のジョン.テユーキーは、少なくとも?学分野でデータの真の「次元」は五次元を超えるこ とはめったにないと、かつて提唱した0このテユーキーの洞察を慟かせて、スタンフォード大 学のグルーフは、本aに存在する低次元を探し出すためのコンピユータ集約的な技術を開発した。 これらの技術のうち最も広く使われているのが、射影追跡法なのである。
とかくするうち、大きくてまとまりのない集団での情報がこのように激増してくると、ほかの
科学者の関心を惹くょぅになり、情報科学の分野が多くの大学に現れてきた。多くの場合、これ ら情報科学者は工学的な訓練は受けているが、数理統計学における近年の多くの発展に関心がな い。そのため、コンピユータ科学の世界でも平行して同じょぅな進展があり、ときには統計学の 材料を再発見したり、またときにはかつてフィッシャーや彼の後継者が予想すらしていなかった 新しい分野を切り開いたりしている。これが、本書の最終!^で取り上げる話題となる。
私が一九六六年に博士論文を完成させたとき、いろいろな大学を回って自分の研究業績を報告 し、職に就くための面接をしてもらった。最初の面接の一つがプリンストン大学で、ジョン-テ ユーキーが駅で出迎えてくれた。
自分の研究において私はテユーキIのさまざまな研究対象を学んできた。たとえばテユー キーの自由度一の交互作用、テユーキーの高速フーリエ変換、テユーキーの迅速検定、そしてテ ユーキーの補題などである。だが、探索的データ解析や近年の創意工夫に富んだ仕事などはあま り学んでいなかった。
ジョン■テユーキーは統計学科の学科長だったので(またべル研究所も兼任していた)、彼み ずからが私を出迎えてくれたのには驚いた。彼は、綿のチノパンツにゆったりとしたスポーツシ
ャツとテニスシユ1'スかスニー力ーといういでたちで、私はスーツにネクタイという服装であつ た。六〇年代に起きた服装革命は教授陣にまで浸透していなかったので、私の服装のほうが彼の ょりふさわしいものだった。テユーキーと私は並んでキャンパスを#きながら、プリンストンで の生活条件について話し合った"彼は私が論文をつくるときに組んだコンピユー夕.プログラム について尋ねた。そして、プログラムでの丸め誤差を避けるためのいくつかのnツを教えてくれ た"そうこうするうちに、私たちは講堂に着いた。そこが私の論文発表の会場だった。私を紹介 したあと、テユーキーは階段教室の一番後ろの席に昇っていった。私は自分の業績を話し始めた。 そうしているあいだ、彼は忙しく私の論文を手直ししていた。
発表が終わると、聴衆(大学院生や学部の教員など)の数人から質問されたり、私の研究にょ る副次的影響などを示唆されたりした。ほかに質問やコメントがないことがはっきりすると、テ ユーキーは最後列の席から降りてきて、チョークを手にとり、黒板に私の主定理を書き出し、記 法を完璧なものにした。それから、私自?証明するのに数力月かけた定理に異なる証明をつけた のである。「すごい、これがトップレベルか!」と内心思った。
ジョン■テユーキーは、一九一五年にマサチユーセッツ?ニユーへッドフォードで生まれた。 ボストン訛りのせいでアクセントを長引かせるのが彼の?演に味をつけていた。両親は子供の非 凡な才能に早くから気づいており、ブラゥン大学に行くために家を出るまで在宅で勉強していた。 フラゥン大学では化学で学士^と修士^を取得した。以前から抽象数学に魅せられていたので、 プリンストン大学で博士課程に入り、一九三九年、数学で博士号を取得した。
28 S
彼の最初の分野はトポロジーだった。点集合論的位相学は、数学に理論的基礎づけを与えるも のである。位相的土台の下に横たわるのは、「超数学」として知られた難しく深遠な哲学部門で ある。起数学では、ある数学の冏題をr解く」ということはいったい何を意味するのか、また論 理を使っている背後に隠された暗黙の仮定は何かという疑問を扱う。テューキーはこれらのあい まいで難しい基礎づけに飛び込んでいって「テューキーの補題」をつくり、この分野に大きな貢 献をした。
しかし、テューキーは杣象数学にとどまるょうには運命づけられていなかった。サミュエル■ ゥィルクスがフリンストンの数学科にいて、学生や若い学部教授を数理統計学の世界へと押し込 んでいた。博士号を取得すると、テューキーは人学の数学科に専任講師として任命された。一九 三八年、まだ数学の博士論文を書いている最中に、数理統計学での最初の論文を発表した。一九 四四年までに、彼の発表する論文はほとんどすべて、数理統計学に関するものになっていた。
第二次大戦中、テューキーは射撃管制研究所に加わって照準の問題に取り組み、測距儀を評価 し、兵器の問題に関わった。この経験が将来取り組むことになる統計的問題の数多くの例題を与 え、また実際問題の本質が何たるかを正しく認識させもした。重要な経験をまとめた彼の一行警 句集がある。実際の仕事から生じたもので、その一つはこうだ。
「止しい疑問に対する近似的な解を持つほうが、間違った疑問に対する正確な解を持つょりまし である」
テユーキーの多才
パブロ-ピカソ(Pablo Picasso)はその変幻自在な作品で1 :〇世紀初頭の芸術の世界を驚かせ た。しばらくのあいだ、彼はモノクロ画を描いていたが、キユービズムを興し、古典主義の手法 を検証し、セラミックスへと向かった。ピカソが足を踏み入れたところはどこも、芸術に革命的 変化がもたらされ、ピカソが他へ移ったあともほかの人々はそれを続けた"その点ではジョン- テユーキーも同じだった。!九五〇年代に、テユーキーは確率過程のアンドレィ■コルモゴロフ のアィデアに関わるょうになり、「高速フーリエ変換(FFT)」で知られる、長い一連の相関を 持つデー夕を解析するため、コンピユータ集約的な技術を発明した。「ピカソといえばキユービ ズム」のょうに、テユーキーは十ニ分に才を発揮し、科学における彼の影饗は計り知れないもの となることだろう。
!九四五年にテユーキーは軍務で、ニユ?ジャージー州マーレーにあるベル研究所に行くこと になり、種々の実際問題に巻き込まれていった。一九八七年に記録された会話で彼はこう語って いる。
「ブデンボム(Budenbom)という名の技術者がいて、彼は飛行標的を追跡するための新しい超 高性能追跡レ?ダーを開発していた。研究発表をするためにカリフォルニアに行きたがり、追跡 エラーといった類の結果図をほしがった」
ブデンボムは問題を周波数領域で定式化していたが、周波数振幅の一致推定量を得る方法を知 らなかったのだ。テューキーは数学者としてフーリエ変換を熟知していたが、この技術を工学に 応用したことはなかった。彼は工学者が満足するだろう手法を提案した(正しい疑問に対する近 似的な解の有用性についてのテューキーの警句を思い出してほしい0しかし、テューキー自身 はそれに飽き足らず、この問題について考えつづけたのである。
その結果が高速フーリエ変換であった。それは一種の平滑化技術で、テューキ!の表現を使え ば、近くの周波数から「力を借りる」ものであるから、よい推定量を得るのに膨大な量のデータ を必要としなくなった。これはまた、考え抜かれた最適な性質を持つ理論的な解法でもあった。 結果としてこれは効率的なコンピュ^タ.アルコリ'スムである。コンヒュータが今よりも遅く て少ないメモリーしかなかった一九五〇年代と六〇年代には' このようなアルゴリズムが求めら れていた。そして、:::一世紀に入っても使われつづけている。というのも、現在の複雑な?換推 定量よりも高速フーリエ変換が正確さで優れているからだ。
コンピュータとその能力は統計研究の最前線を絶えず推し進めている。コンピュー夕が巨大な 行列(ジx-ローム■コーンフィールドが機械式計算機では数百年もかかるだろうと言っていたも の)の逆行列を計算できるようにしたことは前に見たとおりである。コンピュータにはもう一つ. 統計理論を?倒するかもしれない脅威的な面もある。これは膨大なデータ量を蓄えて解析するこ とのできるコンピュータの能力に根ざしている。
一九六〇年代から七?年代初頭にかけて、ベル研究所の技術者と統計学者は、膨大な量のデー
タ解析に取り組んでいた。ランダムに起こる誤差や問題に対して:電話1111線をモニターすると、ー つのコンピユータ■ファィルに数百万X数百万のデータ項目が出てくることになった。また、火 星や木星などの惑星調査のために送られた宇宙探査機からの遠隔測定されたデータは、数百万の 項目を持つ複数のファィルを生み出してしまった。そんな膨大なデータをどのようにして考察す ればいいのだろう力。どうやってデjタの構造を決めてそれを検証することかできるのだろう
o
たいてい、カール.ピアソンによって先鞭をつけられた技術に従って確率分布の母数を推定す ることができる。そうした分布には何かしら仮定が必要で、たとえばピアソンの仮定した条件を 満たすことが求められたりする"では、これらの大量に集められたデータを検証するための手法 が見つかるだろうか。また、その分布に仮定を置くことなく、それらから何かを突き止められる だろうか。
ある意味で、これは優れた科学者たちが常にしてきたことなのである。グレゴール.メンデル は、植物の異種交配に関する一連の実験を行い、その結果を検証し、優性遺伝子と劣性遺伝子に ついての自らの理論を徐々に発展させていった。多.くの科学研究はデータを集め、そのデータを 前もって想定していた特定の分布に適合させることによってなされるが、ただデータを集め、予 期しない事象に対して注意深くデータを検証するだけでも重要で役に立つことがよくあるのであ る0
アメリカの数学者エリック-テンプル.ペル(Eric Temple B£)がかつて指摘したように、
r数は嘘をつかない。しかし、欺く意図がありながら真実を語ってしまうという癖がある」。人は パターンを見がちであり、ただランダムなノイズがあるだけなのに、そこにパターンを見1'|.|1して しまうのだ。
疫学でのデータ検証で、ある特定の場所や時間における病気の「クラスター(塊り)」が見ら れるとき、この傾向は特に厄介なものになる。マサチユーセッツ州の小さな町で白血病に罹る子 供の数が異i吊に多いことがわかったとしよう。これはこの町でがんの原因となるもの力あるこ とを意味しているのだろうか。もしくは、これはたまたまここで起きたランダムなクラスターに すぎず、ほかの場所でも容易に起こりうるものなのだろうか。
化学工場が町の近くの池に化学排水を垂れ流しているのを町民が発見したとしよう。また、白 血病のクラスタ?が生じている町の上水道に微量の芳香族アミンを見つけたとしよう。ひよっと すると、これが白血病を引き起こす原因なのだろうか。もっと一般的な意味において、どの程度 まであるパターンを探すためにデjタを検証できたり、ランタムなとらえどころのないもの以上 のものをそこに見つけることが期待できるのだろうか。
一九六〇年代になって、テユーキ;はこれらの問題を真剣に考え始めた。' そして、データに対 する力ール■ピアソンのアプローチを高度に精密化することでこれを明らかにした」観測データ の分布が、任意の確率モデルを想{疋せずに一つの分布として検証されうることがわかったのであ る。その結果は一連の論文となり、学会で発表され、最終的には「探索的データ解析」と呼ぶも のを扱った本になった。この問題への取り組みばかりでなく、テユーキーのプレゼンテーション
のしかたは彼ならではの際立ったものだった。
聴衆や読者にショックを与えて彼らの仮,一疋を再検証してもらうために、データ分布の特性にこ れまで使われてきた名前ではなく、違った名前をつけ始めたのだ。解析の初めにまず標準的な確 率分布ありきというのではなく、彼はデータそれ自身のなかにあるバターンの検証に向かった。
極値が観測のバターンにどのょうに影響を与えるかを調べた。変に誤った印象を調整するため、 彼はデー夕を表示する図示ツールをひと揃い開発した。
たとえば、一組のデータの分布を幽示するための標準的なヒストグラムが誤解されやすいこと を示すとしょう。それらは観測値の最も度数の多い階級に目を向ける。そこで彼が提案したのは、 観測値の度数をプロットする代わりに、度数の平方根をプロットすることだった。彼はこれを 「ヒストグラム」に対抗して「ルートグラム」と呼んだ。
また、デー夕の中心領域は箱型で示し、極値はその箱から出てくる線(これを「?髯」と呼ん だ)として表すことも提案した。彼の提案したッールのいくつかは、多.くの標準的な統計ソフト ウェア.パッケージの:部となっており' 解析者は今ではそれらを「ボックス■プロット(箱ヒ ゲ図ごや「ステム-アンド■リーフ■プロット(幹葉表示)」と呼んでいる。
テユーキーの豊かな想像力はデータ解析の世界を広く展望し、あらゆる角度から見直した。彼 の提案の多くは、やがてコンピユータ■ソフトウェアに取り入れられていくに違いない。彼のニ つの発明はすでに英語になっている。それはテユーキーの造語で、「ビット(bit)」(もとは二進 数字〔binary digit〕)と「ソフトウェア(software)」(コンピユータ■プログラムのことで、コ
ンピユータM体を「ハードウエア(hardware)」というのに対して)である。
テユーキーにしてみれば、独自の洞察で取り組めないようなありふれたものは何もなく、探求 できなレような不可侵なものも何もな力った。単純な集計方法を例にとってみよう。たいていの 読者はたぶん、何かを数えるときに集計図(tally figure)を使ったことがあるだろう。先生から 教えられた普通の集計図は、四本の縦線を引き五本目はその四本を串刺しにするように横棒を^[ くものだった。読者はどれだけ多くの漫画で、ほさぼさ頭の囚人が監獄の壁に一連の集計図をチ ョ^~~クで書いているのを見たことがあるだろうか。
それは集計するのにはバヵらしい方法だと' テユーキーは言った。どれほど間違えやすいか考 えてみたらいい。四本の縦線を三本にしかねない'もしくは五本親に引いてから横線を引きかね ない。そのうえ間違えた集計図は見つけにくい。縦線を注意深くチヱックしない限り、正しいも ののように見えてしまうからだ。間違えた集計図をたやすく見つけられるように集計図を使うこ とのほうが道理にかなっている。
テユーキーは一〇本の集計図を提案した。まず四つの点を箱型になるようにマークする。四本 の線でそれらの点を結び、箱をつくる。最後にニ本の線で箱の対角線を引くのである。
これらの例 高速フーリェ変換や探索的データ解析' はテユーキーの膨大な成果の一部に
すぎない。ピヵソがキユービズムから新古典主義、セラミックス、織り物へと進んだように、ジ ョン■テユーキーはニo世紀後半の統計的領域を、時系列から線形モデル' フィッシャーの忘れ られた仕事の一般化、Dバスト推定、探索的データ解析へと横断していったのだ。
数学の深遠な理論から出発した彼は、実際問題を考え始め、ついには構造化されていないデー タの評価を考えるに至った。彼が足跡を残した統計の分野はどこも、もはや以前と同じではなく なつた。
ニ〇〇〇年の夏に亡くなるその□まで、ジョン■テユーキーは相変わらず新しいアィデアや古 いものに対する疑問で、友だちや同僚を刺激しつづけたのだった。
統計的手法の使用を正当化する数学的定理は普通、科学的な実験や観測から導かれた測定値は すべて等しく有効だと仮定している。解析者がデータのなかから正しそうだと思えるものだけを 選んで使うならば、結果としての統計解析は重大な間違いを犯していることになる。しかし、こ ういつたことは科学者のあいだでょく行われてきたことなのだ。
一九八〇年代初め、スティーブン.スティグラー(stephenstigler)は"一九?七年のノーベ ル賞受賞者で光速度を確定したアルバート.マィケルソンのょうな、一八肚紀からー九世紀の偉 大な科学者たちのノ ?トに目を通していた。スティグラーは、彼ら全員が計算を始める前にデー タのいくつかを捨てていることに気づいた',' ヨハネス-ケプラーは、一七世紀初頭に惑星が太陽 の周りを楕R軌道を描きながらMつていることを発見した人物だが、古代ギリシャまでさかのぽ
第^章
悪影響の?ぃ方
って天文学者の記録を再検討する際にそのようにデー夕を選択していたのだ。つまり、ケプラー はいくつかの観測点が自分の計算した楕円軌道に合致しないことに?づくと、それらを異常値と して無視したのである。
だがもはや科学者たるもの間違っているように思えるテIタを捨てたりはしない。科学に おいて、統計革命が広まりつつあるので、実験者は今やどんなデータであろうとも捨てないよう に教えられている。統計の数学的定理もまた、すべての測定値は等しく有効だと考えるように求 めている。
では、測定値のいくつかが本当に間遠っていたならどうすればいいのだろうか。
i九七ニ年のある日、ある薬理学者がまさにそのような問題を抱えて、私のオフィスにやって 来た。彼はラットを使って潰瘍を予防するための二つの処置を比べていた。一:つの処置が異なる 結果になることを確信し、データも彼の確信を裏づけるかのように見えた"ところが、ネィマン =ピアソンの公式に従って仮説検定を行なうと、その比較は有意にならなかった。問題は、ニつ の処置のうち効果の劣るニ匹のラットのデー夕に起因していると彼は確信した。どちらのラット も潰瘍にならず、他のラットによる実験結果以上に結果をよいほうへと押し上げたのだ。第16章 で、ノンパラメトリック手法がこの種の問題に対処するためにどのように発達してきたかについ て述べた。これらニつの外れ値はデータとしても誤りであり、それらにノンパラメトリック検定 をしても有意にすらならなかつた。
これが一〇?年前の話なら、薬理学者は二つの誤ったデータを投げ捨てて、計算にとりかかっ
ただろうし、誰もそのことを反対しなかっただろう。しかし、彼は現代の統計的アプローチで訓 練されていた。そんなことをしてはならないことを知っていたのだ。幸いにも、新しい本が私の 机の上にあり、ちょうど読み終えたばかりだった。その本は『位置に関するロバスト推定??概 観と進展^obust^stimates 0/. Lostion: survey and Advances)』というもので、ジョン■テ ユーキーの指導のもとプリンストン大学ロハスト性研究として知られた大か力りなコンヒコー タ志向の試みについて記述していた。彼の問題の答えはこの本のなかにあった。
ここで用いられる「ロバスト(robust) S.-G建51.3」という言葉は、アメリカ人の耳には奇 妙な言葉として響くらしい。統計専門用語の多くは、イギリスの統計学者がもたらしたものであ り、もっぱらイギリス英語の語法を反映している。たとえば' データのちよっとしたランダムな 変化を表すのに「エラ? (error)」を使、っのは一般的である。データはときに、明らかに間違っ ているだけでなく、なぜ間違っているのか理由を特定できるような??作づけ地のいかんにより
作物がまつた^の不作となるような 値を含むことがある。そのようなテ^^タをフィツシャ^^
は「ばかな間違い(blunder) Bfc^s3」と呼んだ。
同じようにして、フィッシャーの娘婿であるジョージ■ボックス(Gecrgetdox)はイギリス 慣用に従って「ロバスト」という語をつくった。ボックスは' もともとテムズ川の河:!付近で育 った影響で、強い訛りがあった。祖父は金物商人で、商いはすこぶる順調だったのでボックスの 伯父たちを大学に送れるほどだった。そのうちの:人は神学の教授になった。しかし、ボックス の父親が成人するころになると商売が立ち行かなくなり、父親は高等教育を受けることなく、小
売店の補助仕事で家族を養った。ボックスはグラマースクール!;Ilf ^;齡|5には行ったが、 大学に行くほどには経済的なゆとりがないことを知って、高等専門了^〔lllf-sllnxiEで化学を 勉強し始めた。そのころ第二次大戦が始まり、ボックスは軍隊に召集された。
ボックスは化学を勉強しているところだったので、化学防御試験場に送り込まれた。そこでは、 ィギリスの一流の薬理学者と生理学者の数人がさまざまな毒ガスの解毒剤を見つけょうとしてい た。これら科学者のなかに、ジョン.ギャッダム卿(sir John Gaddum)がいた。ギャッダム卿 は一九二o年代終わりに統計革命を薬理学に持ち込んだ人物であり、数学で確固たる地盤の上に 某礎概念を築いた人物であった。
ボックスが統計学者になる
ジョージ‘ボックスの上司の大佐は、大量のデータを前にして頭を悩ませていた。そのデータ は"異なる容量のさまざまな毒ガスがマゥスやラットに与える影響に関するものだった。ボック スは一九八六年にこのことについて詳しく話している。
私がある日(大佐に)「これらのテータは一吊に変動しているので、データを統計学者の? 点で見る必要がありますね」と言うと、彼は「その通りだ、わかっている。でも、統計学者 を確保できないし、力になりそうな者もいない。君はそれについてどう思うかね?」と尋ね
た"私はこう答えた。「私もあまり詳しくは知らないのですが、前にフイッシャーという人 が書いた『研究者のための統計的方法』という本を読んだことがあります。読んで理解した わけではありませんが、著者がそこで試みようとしたことは理解していると思います」。す ると彼は「なるほど、その本を読んだのであれば、君がそれをするように」と言った。
ボックスは軍の教育部隊と連絡をとり、統計手法の通信講座を受けられるかどうか尋ねたが、 そんな講座はなかった。統計解析の手法はまだ、大学の標準的なヵリキュラムに入っていなかっ たのである。代わりに、推薦図書のリストを受け取った。そのリストは、当時出版されていた本 しか扱っていなかった。そのリストには、フイッシャーの本がニ册と、教育研究における統計手 法に関する本、医療統計の本、山林管理と放牧管理を扱った本が挙げられていた。
ボックスは実験計画に基づいたフイッシャーの考え方に興味を持った。ある計画が森林管理の 本にうまく当てはまると気づき、これらの計画を動物実験にも当てはめてみた(たくさんの実験 計?が綿密に記述されたコクランとコックスの本はまだ出版されていなかった)。たいていそれ らの計画は適切とはいえなかったので、フイッシャーの一般的記述を利用して気づいたことを積 み上げていき、ボックスは自らの計画をつくっていった"
かなり欲求不満となった実験は、志願兵にマスタードガスと違う処置を施した小さなパッチを それぞれ両腕に貼ることを願い出たときのことである"各個体の両腕は相関関係があるので、そ の解析での両腕の相関?係を説明するためには、何かしなければならなかった。何か対処を施さ
なければならないのはわかっていたが、森林管理の本にはこの類のことはまったく書かれていな かった。フイッシヤーの本も同様だった。しかし、ボックスは高等専門学校で化学を十分に学ん でいなかったにもかかわらず、基礎となる数学的原則から研究を進め、適切な計画を導き出した のだった。
ボックスの計画におけるアイデアには、否定的な結果に威力を発揮するものもある。あるアメ リカ人の眼科医が、ちょっと誤って目に入っただけで失明する化学兵器のルイサイトに対して、 最適な解毒剤が見つかったとして試験場へやって来た。この眼科医はウサギを使って数多.くの実 験を行い、論文の束を示してこれが完璧な答えだと雷ったのである。もちろん、眼科医はフイッ シヤーの実験計画について何も知らなかった。実際、実験は欠陥だらけだった"気まぐれに取ら れた本質的でない要因効果から処置効果が分離されていなかったのだ"ウサギの目がニつあるこ とから、ボックスは、相関のあるブロックに対して自分の新しい計画に従った簡単な実験を提案 することができた"この新たな実験により、提案された解毒剤は効果がないことがたちまち証明 された。
これらの結果を踏まえて報告書がつくられた"著者はイギリス軍の少佐で、軍曹であるボック スは、統計的な付録を担当し、いかにしてその結果が得られたかを説明した。その報告書を認め ざるを得なかった当局者は、ボックスの付録を削除するよぅに強要した。ほかの人にはあまりに も複雜すぎて理解できなかったからだ(なによりも、校閲者が理解できなかったのである0し かし、ジョン.ギヤッダム卿はもともとの報告書を読んでいた"ギヤッダム卿はボックスの付録
を褒めるために彼のところに立ち寄ったが、そこで付録が最終報告書から削除されたことを知っ た。ギャッダム卿はいやがるボックスを引き連れて、軍の大きな仮兵舎に怒りながら入っていき. 報告書の校閲委員会の会合に乘り込んだ。ボックスの言葉を使ぇば、「本当に恥ずかしかった。 その場にいるのは、とても威厳のある人で、そこにいた公務員全貝を叱りつけ、『情け容赦なく 捨てられたものを元に戻せ』と言った」。そして、彼らは一も一:もなくそうしたのだった。
戦争が終わり、ボックスは統計学の研究はやってみる価値があるだろうと意を決した"フイッ シャーの本を読み彼がユニハーシテイ.カレッシ■ロンドンで教えていることを知っていたの で、その大学を探して訪ねた"だが、フイッシャーはすでに一九四一:一年にユニバーシテイ.カレ ッジを去り、ケンブリッジ大学遺伝学科の学科提になっていた。ボックスはそのことを知らなか つたので、フイッシャーではなく、エゴン-ピアソンによる面接を受.けることになつた。エゴ ン■ピアソンといえば、仮説検{疋に関するネイマンとの共同研究でフイッシャーから邪険に扱わ れていた人物であった。ボックスは、興奮した口調でフイッシャーの研究についてピアソンに話 し始め、自分が実験計画について学んだことを説明した。ピアソンはボックスの話に静かに耳を 傾けると、こう言った。
「では、ぜひともここへ来なさい"そのうち、統計学にはフイッシャー以外にも一人や二人は研 究者がいる.ことを知るようになると思うよ」
ボックスはユニバーシテイ■カレッジで勉強して学士号を取得すると、修士課程へと進んだ。
実験計画に関する研究を発表し、博士論文として十分の出来だと言われ、博士号を取得した。当
時、インペリアル化学工業(ICI)は新しい化学製品や薬を発見してイギリスでは有名な会社 だった。ボックスはそこの数学部門グループに加わらないかと誘われた。一九四八年から五六年 までICIで働き、注?すべき一連の論文(たいていは共著)を発表した。それらは、実験計画 の技術を拡張したもの、製造過程の出力でその歩留まりをょくするために生産を段階的に調整す る手法を検証したものや、コルモゴロフが提唱した確率過程理論の実際的な応用でのちの研究の 足がかりとなるもの、などであった。
アメリカでのボックス
ショーシ.ボックスはプリンストン大学へ行って統剖手法研究グループ長となり、その後、ゥ イスコンシン大学に統計学科を創設した。彼は、主要な統計機関すベてからフエローといぅ名誉 を与えられ、業績に対していくつか有名な賞をもらい、引返したあとも研究や組織運営で活発に 活動を続けている。彼の業績は統計研究分野の広きにわたっており、理論面も応用面も扱ってい
る'。
ボックスはICIで働いていたときにフイッシャーと面識を持つょぅになったが、個人的に親 しいつき合いではなヵった。ボックスがフリンス卜ン大学で統計手法§究グルーフを指揮してい たころ、フイッシャjの娘の一人ジョゥンはアメリカに行くことになり、友だちがプリンストン 大学での秘書の仕事を彼女に見つけてくれた。そこでボックスとジョゥンは出会って結婚したの
である。ジョウン.フイッシャー.ボックス(JoanFisherBOX)は、一九七八年に父親とその業 績について最も信頼のおける伝記を出版した"
統計学に対するボックスの貢献の;つは「ロバスト」であった。多くの統計的手法が、複数の 数.学的定理に依存していることに関心を持った。その定理には、正しくないかもしれないデータ の分布的性質についていくつかの仮定があった。その数学的定理の条件が成り立たないときです ら役に立つ手法を見つけることができないだろうか。ボックスはこのょうな手法を「ロバスト」
と呼んだ。当初、いくつか数学的研究もしてみたが、結局はロバスト性という概念にかなりのあ いまいさを残しておくことにした。というのも、::般的であいまいな概念のほうが手法を選ぶ際 に利点が多いと考え、もっときっちりとした意味を与えるのを嫌ったからだった。
しかし、その概念は、そのあいまいさゆえに自滅する羽Hになった=仮説検定のロバスト性が、 誤差確率の点から定義されたのである。フイッシャーの幾何学的発想の:つを拡張することにょ って、スタンフォ|ド大学のブラッドリー.エフ0ンはー九六八年に、ステユーデントの1検定 がこの意味でロバストであることを証明した。E.J.G ■ピットマンの手法は、たいていのノ ンパラメトリック検定が同じ意味でロバストであることを示すのに使われた。
一九六o年代終半、プリンストン大学のジョン■テユーキーとその学科メンバーと学生のグル hプは、明らかに問違っている測定値をどう処理すればいいかという問?に取り組んだ。この結 果はプリンストン大学ロバスト性研究と名づけられ、一九七一:年に本として出版された。この研 究の背後にある?本的なアイデアは、汚染された分布だった。得られた測定値のほとんどが、推
定したい母数を持つ確率分布から得られたと仮定されるが、実際には、ほかの分布から出た一;、 三の値によって測定値が汚染されているのである。
汚染された分布の典型的な例として第二次大戦中の出来宰を華げよう。アメリヵ海軍は新しい 先波測距儀の開発中で、使用に際しては標的の三次元立体像を視界に捉え、標的のちようど「上 に」三角印がくるように合わせるというものだった。この装置の統計的誤差の度合いを確定する ために、数百人の水兵を使って、あらかじめ距離を測った位置に置かれた標的の距離を実際に測 ってみるという実験が行われた。各水兵が測距儀を使う前に、乱数表によって標的の位置がリセ ットされたので、前の設定が影響することはなかった。
この研究を計画した技師は' 二割の水兵が立体的に物を見ることができないことを知らなかっ た。いわゆる弱視である。この実験のおよそ五分の一は完全に間違っていたのである。手元のデ 1タだけでは、どのデータが弱視の水兵によるものであるかを知る術がなかったので、汚染され た分布から個々の測定値を識別することはできなかった。
プリンストン大学の研究は、コンビユータを使った膨大なモンテヵルロ研究で大量の汚染さ れた分布をモデル化した。彼らはある分布の中心的傾向を推定する手法を考察していた。突き止 めたことの一つは、データが汚染されていると、好んで使われる平均値がきわめて悪い指標とな ることだつた。
そんな状況の格好の例は、一九五〇年代にィHhル大学が、卒業後一〇年経つi兀学生の収入を 推定するために行った調査だった。全員の収入の平均値をとるとかなり高い値になった"という
のも、卒業生の数人が億万長者だったのである。実際、卒業生の八割は平均値以下の収入であっ
た。
プリンストン大学のロバスト性研究は、汚染された分布からの一つの外れ値ですら平均値に大 きな影響を与えることを発見した。これは、薬理学者が私のところに持ってきたラットの潰瘍研 究のデータに起きていたことだった。データをすベて使うようにと教えられてきた統計手法は平 均値に依存していた。ここで読者は次のように異議を唱えるかもしれない。もしもこれらの極端 でI見間違っているかのように見える測定値が正しいとしたら、もしもデー夕が汚染された分布 からではなく、調べたい分布から得られていたとしたら、どうだろう。そのようなデータを捨て てしまうなら、結論に偏りが生じることになつてしまう。
プリンストン大学のロバスト性研究では、実行すべき二つの解決法を示した。
1汚染された測定値があれば、その影響を軽減せよ。
2測定値が汚染されていないときでも、ロバスト解析で正しい答えを導け。
私はその薬理学者にこの解決法の一つを使うようにアドバィスし、彼はそのデー夕を理解する ことができた〔解決法の10さらなる実験で矛盾のない結論を得て、ロバスト解析が正しいこ とを示した〔同じく 2J。
ボックスとコックス
1C Iにまだ勤めていたころ、ボックスはよくユニ 'ハーシテイ■カレッジの統計グループを訪 ねた。そこで彼はデイヴィッド.コックスと出会った。コックスはすでに統計学の偉大な変革者 となりつつあり、力ール-ピアソンが始めたバイオメトリ力誌の編集者を務めていた。お互い似 たような名前であるというおかしさと、「ボックスとコックス」がイギリスでは演劇用語で一つ の役割を二人の役者が交代で演じる意味であったことに、二人はいたく感心していた。また、イ ギリスの古典的なミユージカル.コメデイーで、ボックスとコックスと呼ばれる二人の男が下宿 屋で同じへッドを借り{C 一人はぺッドを使い、もう一人は夜中へッドを使うという寸劇も あった。
ジョージ.ボックスとデイヴイッド■コックスは一緒に論文を書こうと決心した。しかし、;:: 人の統計の関心は同じ領域ではなかった。数年が過ぎ、彼らが時あるごとに論文を完成させよう としながらも、互いの関心はまったく異なる方向へと進んでしまったため、論文では統計解析の 性質に関するニつの異なる哲学的立場を調整しなければならなかった。一九六四年、その論文は ついに王立統計学会誌に発表された。この論文は「ボックスとコックス」として有名になり、そ れ以来、統計的手法の重要な意味を担うようになった。
論文で彼らは、たいていの統計的手順でロバスト性が増すように測定値を変換するやり方を示
した。「ボックス=コックス変換」で知られる変換は、毒理学研究で生きている細胞に対する化 学変化的効果の解析に使われたり、計量経済学の分析で使われたり、フィッシャーの手法を生み 出した農業研究でも使われているのである。
一九八o年、アメリカのNBCテレビは「なぜ日本にできて、われわれにはできないのか」と いぅドキユメンタリー番組を放映した。アメリカの自動車メー力ーは、日本の挑戦に動揺してい た。日本車の品質は一九七〇年代のアメリカ車ょりも優れていたぅえに、価格も安かった。鉄鋼 からエレクトロニクスにいたる他の産業分野でも、日本企業はアメリカ企業を品質とコストの両 mで凌駕していた。NBCのドキユメンタリー?組は、こ、っしたことがいかにして生じたかを検 証していたのである。番組では:人の男を切り口に、彼が日本の産業界に与えた影響を描いてい た。その男とは、肖時八〇歳のアメリカ人統計学者、W -エドヮーズ*デミングであった。
一九三九年にアメリカ農務省を退職後、産業コンサルタントとして働いていたデミングは、
の番組を機に突如、引っ張りだことなつた"品質管理の助っ人として、アメリカの自動車メー
第聲章?業を再生した男
力こ
hに何度も招聘されるようになった。デミングはT業化を改善する優れたアィデアを開発してい たが、これらの企業の経営幹部は品質管理の「専門的な」詳細に関心を持たなかった。彼らは専 門家を雇うことで満足し、品質管理??それが何であったとしても??を任せきりにした。
第一:次大戦後、.ダグラス*マッカーサー特軍が占領下のH本で連合国最高司令官に任八叩される と、H本に民主的な憲法を制定させ、この国を啓発するために「アメリカ方式」に長けた一流の 専門家を呼び寄せた"一九四七年、マッ力ーサーのスタッフは、統計的標本理論の専門家として W ,エドワーズ■デミングに白羽の矢を立てた"デミングは日本人に「アメリカ方式」を教え込 むために日本へ送り込まれたのである。
E本でのデミングの活動は日本科学技術連盟(JUSE:日科技連)会長であった石川一郎に 強烈な印象を残し、デミングは幅広いH本産業界のために企画された一連のセミナーで統計手法 を教えるため、ふたたび日本に招かれた。石川は多くのR本企業の経営幹部の声を拾う耳でもあ った。石川の招きで.経営者たちはしばしばデミングの講演に;1'<席した。
当時「日本製」といえば、安物で、他国製品より品質の劣る模做品を意味した。日本製品をそ のように呼んでいた講演の出席者は、ほぼ五年以内にそのレッテルを替えられるというデミング の言葉に衝撃を受けた。彼は耳を傾ける経営者たちに、品質管理の統計手法を正しく使うのだ、 そうすれば高品質でありながら低価格の製品を生産でき、世界中の市場を席捲するようになる、 と説いたのである。
デミングはのちに、そうなるまで五年かかると予想したのは間違いであったと語っている。日
本人は五年どころか、ほぼニ年で彼の予想水準にまで達したのだ"
デミングの講演に深く感銘を受けたH科技連はデミング賞を設け、以後、毎年R本の産業界に おける品質管理の効果的な新手法の開発を奨励している。日本政府も、統計手法を用いることが あらゆる活動の改善につながりそうだとして動き出した。そして文部省は「統計の日」を制定し、 年に一度、児童-生徒たちの統計を使った発表に対して表彰を行っている
そう^-^カ^必^^したこ厂^あ 一巧?。統計手法は日本全体に広がったが、そのほとんどはデミングのセミナ 1から始まつたのである。
経営幹部へのテミングのメッセ^~シ
一九八O年にNBCのドキユメンタリー番組が放映されたあと、デミングはアメリカ産業界か らもてはやされた。彼はアメリカ的経営に対する独自のアィデアを紹介する一連のセミナーを記 画した。だが、あいにくアメリカ企業の経営幹部が実際デミングに耳を貸すことはほとんどなく、 すでに品質管理を知っている技術専門家をセミナーに送ったにすぎなかった"経営のトップ層が 出席することはめつたになく、あつたとしてもごく稀なことだつた。しかし、デミングのメッセ 1ジは、経営者に向けて発せられたものだった。それは、経営者,:.Iとくに経営幹部??はその 役割を果たしてこなかつたという、耳が痛くなるょうな辛辣なメッセーシであった。このメッセ 1ジを2Eに見えるかたちで説明しょうと、デミングはセミナー参加者に製造現場を想定した実.験
を受けさせたのである。
セミナー参加者たちは、作業員、検査員、マネジャーの三つの役に割り振られた。作業員役に は簡単な作業をさせた。目の前には白いビーズがドラム缶いっぱいに入っており、なかにはわず かに赤いビーズが混じっていた"作業ではドラム缶を勢いよく何度も回して中身をよく混ぜ合わ せるように教え、よく混ぜ合わせることが大切であると強調された。
次に五〇個の小さなくぼみのあるパドル(.櫂)を渡された。くぼみはビーズー個ずつが入るほ どの大きさであった。ドラム缶のなかにパドルを通すと、作業員は正確に五o個のビーズをすく い出せるようになっていた。参加者たちには、顧客のクレームを防ぐために五?個中赤いビーズ が三個以上含まれてはならないと営業部門から決められており、またその標に向かって努力し なければならないことが知らされた。
作業員がビーズでいっぱいのパドルを持って現れると、検査員は赤いビーズの数をかぞえて記 録した。マネジャーは記録を調べて、赤いビーズの数が少ないか、多くても許容量の三に近い作 業員を誉め、赤いビーズの数が多い作業者を叱った。その証拠にマネジャーは、しばしば無器用 な作業員の手を止めさせ、器用な作業員のやり方を観察するように言い、課せられた仕事をどの ようにして正確にこなせばいいか学ばせようとしていた。
ドラム缶のビ?ズのうち、五分の一は赤だった。赤いビーズが混じるのが三個以下となる確率 は一%未満。しかし、赤いビーズが六個以下となる確率は約一〇%だったので、作業員は多くて 三個の赤いビーズという屈きそうで届かない魔法の0標に、しばしばじらされながら近づいてい
った。平均的には、作業員たちは 一?個の赤いビーズを取り出していたが、これは経営者が満足 できるものではなかった。ことによってはI三個から一五個の赤いビーズを取り出す作業員もい たが、これは明らかに、かなり下手な作業の結果であった。
デミングが指摘したかったのは、経営者がー方的に達成不可能な水準を設定し、水準が達成可 能かどうか、あるいは水準に合わせて技術を変えるためには何をすべきかなど考えようともしな いことがあまりにも多すぎる、ということだった。それどころかアメリカの経営幹部は"水準の 維持は品質管理の専門家に任せきりで、工場労働者が抱くであろう不満を無視している、とデミ ングは苦言を呈した。
アメリカ産業界に広まった経営方法の一時的な流行を、デミングは痛烈に批判した。一九七〇 年代に流行った謳い文句は「不良品ゼロ」であった。生産物に不良品がないという状態は、デミ ングにしてみれば完全にあり得ないのである。(ちようど、デミングがアメリカ産業界に強い印 象を残した)一九八o年代には「総合的品質管理(TQM)」がもてはやされた。デミングはこ れらすべてを屮身のない言葉であり、現実の仕事をすべき経営者からの説教以上のものではない、 と見ていた。
デミングは著書『危機の中から〇&〇/麥0〇1?5)』のなかで、彼がある会社の経営者に書い た報告書を引用している。
貴社が抱える問題、すなわち低い生産高、高いコスト、品質のバラッキなどについて検討
いたしました結果をご報告申し上げます。……トップ■マネジメントが實任を果たす姿勢が なければ、品質改善を成し遂げたとしても、恒久的な影響を持ちません。……品質の責任を 負わず、責任に従って行動してこなかったあなたがたの経営こそが、私の考えでは、貴社の 問題の主たる原因です。あなたがたの会社がしていることは、……品質管理ではなく、ゲリ
ラ的に狙いを撃つことです ンステムは組織化されておらず、システムとして品質管理を
することの用意もなければ正しい理解もありません。あなたがたは、失火後、火が燃え広が る前に現場に急行できるよう願っている消防署を運営してきたようなものです……。
あなたがたがあちこちに貼っているスnhガンは誰もがただ完璧な仕事をするように促す もの以外の何ものでもありません。どうやってそれを実践できるのか、私には疑問です。一 人ひとりが自分の仕事を改善せよということでしようか。自分の仕事が何なのか、またその 改善方法を知る術のない人が、どうやって自分の仕事を改茜することができるのでしようか。 原材料の欠陥、供給量の変更、機械の故障といった条件下ではいかんともしがたいでしよう。 ……別な障害は、製造に従事している労働者にすべての問題(トラブル)の責任があるとす る経営者側の想定です。製造従事者が正しいと思っているやり方で仕事をしている限り、製 造現場で問題が起きるはずがありません。……私の経験によれば、製造?場における多くの 問題は共通の原因に根ざしていて、その原因は経営者側だけが減らしたり、除去したりでき るのです。
品質管理についてのデミングの主要な観点は、ある生産ラインでの産出量にはバラツキがある、 ということである。すべての人間活動の性質から考えても、産出:aにはバラツキがあってしかる べきである。デミングが主張しているように、顧客が欲しているのは完璧な製品ではなく、信頼 できる製品なのだ。顧客はだいたいの予想がつく程度のバラツキの小さい製品をほしがるものな のだ"フイツシャーの分散分析を使えば、分析者は製品のバラツキを二つの原因に分けることが できる。一つの原因は、デミングが「特殊要因」と呼んだもの、もう一つはこれまたデミングが 「一般要因」または「環境要因」と呼んだものである。デミングは、アメリカ産業界の標準的な 方法が全体のバラツキの許容水準に上限を設けてしまうと批判した。もし、バラツキがその上限 を超えたときには、生産ラインを停止して特殊要因を探すのだ。しかし、デミングが主張したよ うに、特殊要因はほとんどないし' 簡単に特定できる。かたや環境要因は常に存在し、お粗末な 経営の結果である。たとえば、機械の手入れを怠ったりとか、仕入れた原材料の品質にバラツキ があったりとか、ほかにも作業条件が整っていなかったりなど、環境要因はしばしばさまざまな かたちで表れるからだ。
そこでデミングは、生産ラインを原材料に始まり最終製品にいたるまでの諸工程の流れとして 見ることを提案した"各工程は測定可能であり、それぞれ環境要因によってバラツキも異なる。 最終製品の段階まで待って、あらかじめ設定したバラツキの範囲を超えていないか確認するので はなく、マネジャーは各工程でのバラツキを注視すべきなのだ。最もバラツキの大きい工程にこ そしっかり取り組む必要がある"いったんそのバラツキを小さくしても、別のところで「最もバ
ラック」工程が生まれ、それに対策を講じなければならなくなる。こぅして品質管理は連続的な プロセスとなり、そこでは生産ラインの最もバラツキのある部分は絶えず変わっていくのである。
デミングのアプローチが結実したところでは、大きな修理をせずに 一o万マイル以上も走る日 本車、最小限の保守しか必要でない船舶、バッチごとに品質が安定している鉄鋼など、その他の 産業でも品質のバラッキが抑えられている。
品質管理の本質
ベル研究所のウォルター■シユーハ?^と商務省標準局のフランク■ヨーデン(Frank Youden)は一九二〇年代から三〇年代にわたってアメリカで最初の統計的品質管理プログラム をまとめ上げ、産業界に統計革命をもたらした。デミングは統計革命を経営上層部へと進めた。 最小限の数学的知識しかない管理者のために書かれた著書『危機の中から』のなかで、多くのア イデアはあいまいすぎて、生産現場では使えないことを指摘した。自動車のピストンは円形でな ければならないが、こぅ雙ってみたところで、そのピストンの丸みを測る方法がなければまった く意味がない。製品の品質を改善するには、その品質が測定できなくてはならないからだ。製品 の特性を測{疋するためには、その特性(たとえば丸み)が十分に定義されていなければならない のである。
すべての測定値は元来バラッキがあるものだから、生産プnセスには、測定結果の分布の母数
に取り組む必要があるのだ。ちようど力ール.ピアソンが母数の変化によって進化の証拠を見出 そうとしたように' 経営者はこれら測定分布の母数を監視し、母数を改善するために生産プロセ スの基本的構造を変える責任があると、デミングは主張した。
さて、私がはじめてデミングに出会ったのは、一九七〇年代の統計学の学会でのことだった。 背が高く、批判的な意見を抱いた、ときにはいかめしくもあるデミングは、統計学者のなかで恐 るべき人物であった。質疑応答のときに彼が立ち上がって批判を述べることなど、めったに見か けなかったが、デミングにとって明白なことを証明できなかった人間を討論後わきに呼び出して いたようである。
私が目にしたいかめしい表情のこの批評家は、友人たちの前では別の表情を見せた。私が見た のは彼の公的な顔だった。彼は一緒に働く人々に対する親切心や思いやりのある人間として、武 骨ではあるが繊細なユーモアの持ち主として、また音楽に興味のある人間として知られている。 合唱団で歌い、ドラムを叩き、フルートを奏で、独自の宗教音楽の作曲.出版もした。彼が出版 した音楽の一つは、「星条旗よ永遠なれ」の〔編曲した〕新版で、通常のものよりも歌いやすい ものになつている。
デミングは一九〇〇年にアイオワ州スーシテイーで生まれた"ワイオミング大学在学中は数学 を学んだが、工学にも強い関心を持っていた。コロラド火学で数学と物理学の修士号を取得し、 妻のアグネス-ベレ(>ぬ11633£6}とはここで出会った。ニ人はー九ニ七年にコネチヵット州 に移り、デミングはイH1ル大学の物理学の博士課程で学び始めた。
デミングが最初に産業界と関わりを持つようになったのは、イリノイ州シセロにあるウェスタ ン*ェレクトリック社のホーソン工場であった。彼はイヱール大学在学中の?夏、そこで働 いていたのである。ウォルター.シユーハートはニユ1ジャ1ジー?にあるべル研究所で統計的 品質管理の進礎づくりをしていた。ウェスタン-エレクトリック社は同会社(AT&T :アメリ 力電信電話会社)の別部門で、シユーハートの手法をホーソン工場に応J-I-Jしようとしていた。
だが、デミングはシユーハートのメッセージが理解されていないことに気づいた。品質管理は 設定されたバラツキの許容範囲に基づいた一連の機械的動作となっていたのだ。その許?範囲は しばしば、品質管理のHをすり抜けてしまう不良品が一定時間内に五%以下と設定された。デミ ングはのちにこうした品質.管理は裏を返すと、五%の顧客は絶対満足しないということだとして 退けている。
デミングはイヱール大学で博士号を取得すると、|九ニ七年にアメリヵ農務省に入り、一一';年 間にわたり標本抽出法と実験計画法に携わった。コンサルティング会社を立ち上げるために役所 を辞め、産業界で品質管理一を利用するためのセミナーを開き始めた。これらのセミナーは第:.::*次 大戦中に約;::〇〇o人の設計者やェンジニアを訓練するまでに拡大した。その教え子たちは彼ら の会社で同様のセミナーを行い' 戦争終結時までに、デミングが訓練した品質管理の専門家は、 その弟子を含めると、およそ三万人に達した。
デミングが最後にセミナーの壇上に上がったのは、一九九ニ年一ニ月一〇円のヵリフォルニア でのことだった。セミナ1の大部分は彼の若い弟子たちが運営していたが、九三歳の]\‘ェドヮ
1ズ■デミングも講演した。:;:一月ニon、デミングはワシントンDCの自宅で亡くなった。一 九九三年一一月デミングの家族と友人たちによって、「商業、繁栄、平和をもたらす奥深いデミ ングの知識体系の理解を促進するために」、W*エドワーズ■デミング研究所が設立された。
仮説検定についてのデミングの見解
第11章でネィマンとピァソンによる仮説検定の発展と、それがどのようにして現代統訃学の主 流となったかを見た。デミングは仮説検定にかなり批判的だった。仮説検定の使用が拡大してい くことを冷やかな目で見ていたのである。というのも' 彼が主張するように、誤った問題に焦点 を当てていたからだ。彼は次のように指摘した。
「実際の問題は八と6'ニつの処理の違いが有意かどうかなどではない。(両者に)差異がある とすると……その差異がどんなにわずかなものであっても……実験をかなりの回数くり返せば有 意となる ことがわかるのだ」
ゆえに' デミングにとって有意差を発見することは何の意味もない"重要なのは' 差異の程度 を見出すことである。デミングはある実験状況で見つかる差異の程度は、別の実験状況では異な っているかもしれないことを指摘した。統計学の標準的な方法は、デミングにとって問題解決の 手段としては使えなかったのである。こういった統計手法の限界を知ることは重要である。デミ ングが評しているように、「統計学者は問題に関心を持たねばならないし、統計的推論とその限
界を学び、かつ教えなくてはならない。推論の限界を理解すればするほど、……一連の結果から 推論はますます有用になる」のである。
デミングが警鐘を鳴らした統計的推論のこれらの限界については、本書の最終章で見てゆくこ とにしよぅ。
ニ〇世紀初め、統計手法の発展を担ってきたのは主に男性の理論家だったが、私が専門家とな った一九六?年代までには、注Hされる地位に多くの女性が就いていた。これは特に産業界や政 界に当てはまる。アメリカン,シアナミド社のジュディス■ゴールドバーグ(Judith Goldberg) や、ジョンソン製薬会社のポーラ■ノーゥッド(plaNoigd)は、製薬会社の統計部門を統 括していた。メィビス.キャロル(Mavis Carroll)はゼネラル?フーズ社で数学.■統計サービス 部門の責任者だった。ヮシントン0〇では、女性たちがセンサス局、労働統計局、国立懊康統計 センターなどで監督する立場にあった。
こぅしたことはィギリスやョーロッパ火陸でも同様だった。本書の第19章では、こ、っした女性 たちの何人かに光をmて、統計学の方法論の発展に果たした役割を見た。
第f章Kずくめ女史のアドパイス
統計学で名を馳せた女性たちの経験に典型的といえるものはない。彼女らの誰もが注目すべき 人物であり、その成長ぶりや業績には一つとして同じものはない。統計学を代表する女性を;人 だけ挙げることができないのは、男性でも一人?げられないのと同じことだ"しかしながら、産 業界と官界の両方でめざましく活躍した、ある一人の女性の経歴にスポットを当てるのは興味深 いだろう。その人、ィギリスのステラ.カンリフ(stellacunliffe)は王立統計学会の会長に就 いた最初の女性である。本章の大部分は彼女の学会会長年次講演から引用しており、それは一九 七五年一一月一二:!;の学会に先立って発表されたものである。
ステラ.カンリフを知つている-R ともに働いたことがある人たちは、彼女の幅広いユーモア のセンスと鋭い良識、そして複雑きわまりない数学モデルをともに働く科学者たちが理解しやす いように変えてしまう能力を認めている。この多くが彼女の講演からにじみ出ている"その講演 は、抽象理論の発達に当てる時間を減らし、他分野の科学者との共同研究により時間をかけよ、 という王立統計学会の会員たちへの願いが込められている。たとえば、彼女はこう述べている。
「統計学者として、多くの社会学者のぞんざいな手法を軽蔑したところでせんないことです。彼 らをもつと科学的に認められた思考へと導こうとする心構えがないことには。そのためには、私 たちとの相互交流がぜひとも必要なのです」
彼女は実験過程で起きた思いもよらない出来事をよく引き合いにだしている。「大麦を試験し ているというのに、手入れの行き屈いた調査圃場においてでさえ、ばかなトラクター運転手がお 茶をしに急いで帰ろうとするあまり近道をして、用地を横切つては実験を台無しにしないとも限
りませんでした」
カンリフは一九三?年代後半にロンドン-スクール■才ブ.エコノミクスで統計学を学んだ。 そこで刺激に満ちた時を過ごした"多くの学生や教授陣の何人かは、ファシストに反対してスぺ インA民戦争に進んで手助けすることを申し出た。ナチス■ドイツから逃れた著名な経済学者、 数学者、そのほかの科学者たちがそこで任期つきの教員となった。彼女が学位を取得して卒業し たとき、世界中がまだ大恐慌にあえいでいた。彼女はたった一つデンマーク.ベーコン社の仕事 を見つけ、「そこでは数理統計学を使うことはわずかで、私は統計学者として、とりわけ女性統 計学者であることにかなりいぶかしい目を向けられました」'」第二次大戦が始まり、カンリフが 食糧配給の問?に関わるょうになると、彼女の数学的スキルがとても有用であることが証明され たのである。
終戦からニ年間、カンリフは荒廃したヨーロッバで救援活動にボランティアで参加した。オラ ンダのロッテルダムでは、降服したドイツ軍がまだ明け渡している最中、一般市民が飢えている ところへ最初に乗り込んだうちの一人だった。また、解放まもないベルゲンHベルゼンへ赴き' そこでユダヤ人強制収容所の犠牲者たちの援助に当たった。そして、イギリスの占領区の難段キ ャンプを最後に支援活動には終止符を打った"一文無しでボランティア活動から戻ってくると、 職のロがニ件ほどあった'」一つは食糧省で「油脂」局の仕事に就かないかというものだった。も うーつはギネスビール?造会社の仕寧でカンリフはこちらの申し汁に応じた。「ステコーデン ト」のペンネームで研究発表していたウィリアム-シーリー■ゴセットがギネス社で統計部門を
max立したことを思い/-I1,してほしい。カンリフはゴセットが亡くなつてからおよそ一〇年後にやつ て来たが、彼の影響はギネス社でまだ強く残っていた。彼は崇拝され、彼がつくり出した実験理 念は科学的な仕事を支配していた。
ギネス社での統計学
ギネス社の従梁員は自社の製品に信頼を寄せ、また製品改良のために続けられている実験を信 じていた"彼らは、
原料が変わっても、それが天候や土壌条件、大麦やホップの品種で変わったのだとしても、 一{疋の製品を生産するために、経済的に可能な限り、決して実験をやめませんでした。従業 員は自社製品に並々ならぬ自信を持っており、ご存じかもしれませんが、一九:I九年まで宣 伝をいつさいしてきませんでした。というのは、ある考え方??私が退社したときにもまだ 根強く残っていた心構え??によるためで、ギネスのビ?ルが市販されている製品のなかで 一番であり、販売促進のためにその品質を宣伝する必要はなく、飲まない人に官;伝するより もむしろ同情するような考えなのです!
カンリフはギネスでの駆け出しのころをこう振り返つている。
ダブリン醸造所へ「研修」にやって来たときのことでした。私はかつてドィツでそうして きたように、ここでも自由で多くの刺激に満ちた生活を送れるものと思いなからある朝 ここの「女性職員」を取り仕切る女史の前に呼ばれました。彼女は見るからに近寄りがたく、 全身黒ずくめで喉元に小さなレースがクジラのヒゲ細工で留めてありました。……彼女は私 に、ギネスのために働くことを選ばれた者の特権であるかのように印象づけ、ストッキング と帽子の着用が義務づけられていることを気づかせ、そしてもし幸運にも廊ドで「釀造(技 術)者」と思しき選ばれし人と1[|..1会うことがあれば、実際、私には彼がそうだとわかること .はなかったのですが、彼が通り過ぎるまで私は目を伏せなければならなかったのです"
一九四六年当時、ギネス社内のピラミッド世界では女性の身分はこのようなものだった" カンリフはギネスですぐさま頭角を現し、アィルランドの農事試験に深く関わるようになった。 机に張りつき、現場の科学者から送られてくるデータを分析するだけでは飽き足らなかった。0 ら現場へ足を運び、,目らのDTで何が起こっているのかを見届けた(新参の統計学者なら、彼女を お手本にするのがいいだろう"実験室の研究者からまるでリレーのように何人もの手を経てきた 実験報告書では、実際にあったこととはしばしばー致しないことにびっくりする0
霧と冷気が立ちこめる早朝七時、よく私はお腹を空かせて身震いしながらホップ農園にいました"実はこれが生きた実験に役立つのです。私がわざと「生きた」という:一一0葉を使うの にはわけがあります。もし実験が統計学者にいきいきと受け入れられなければ、そう、実験 者の熱意を統計学者が分かつことなしには、私は彼の研究に対する貢献を低く?積もって? 呑みにしてしまいます。統計学者として大切なのは、一つに柔軟でなければならないという ことです。つまり、しなやかに頭を切り替えられなければならないのです。微生物学者が新 種の酵母をつ^りnすのを助けること力ら農学者が牛にある飼料を摂取させた結果できた 滅肥の品質を評価するのを手^いゥィルス学者とニユーヵッスル病の抗体をつくり出すこ とを^議し、保健所長がモルト貯蔵庫の埃の健康に及ぼす影響について評価することに手を 貸し、.エンジニァには大量生産された製品をべルトコンべ^で流す実験について助言し、 食堂に対しては待ち行列理論のセオリーを適用し、社会学者が集団行動について彼の理論を 試験することを手助けすることまで、さまざまなことに関わるのですから。
ここに並んだ多.様な共同作業は産業界で活躍する統計学者の典型的な仕.である。私の経験で は、化学者、薬学者、毒物学者、経済学者、臨床医、そして経営者(彼らには意思決定のための オペレーションズ.リサーチ-モデルを開発した)との交流がある。これは統計学者としてその 仕事冥利に)^きることの一つである。数理統計学の手法はいたるところで使われ、統到学者は数 学的モデリングの専門家としてほとんどどんな分野の活動においても協働することができるので ある。
予期できない変動
講演のなかで、ステラ*ヵンリフは変動の最たる要因??^すなわち人類ホモ-サピエンスにつ いて思いめぐらしている。
美味たる液体??^ギネスビール^??の開発に一役買っている試飲実験の多くに関われるこ とは、私の喜びでした。実験に関与するうちに私は、人とは偏見や先入観なしには、そして
人々を惹きつける嗜好の特性なしにはいられないということがわかり始めました。 誰し
も数字や文字、もしくは色などに先入観があり、みんながみんなとても驗を担いでいるので す。私たちはみな不合理な振る舞いをします。ょく?えているのがビールに適した温度を 突き止めるためにとても大がかりな実験をしたときのことです"試飲者を異なる温度設定の 部屋に座らせ、これまた異なる温度のビールを飲むというものでした。白衣を着たごくわず かな男性たちが、さまざまな温度の水を張ったバケツにビールを入れて階段を何往復もし そこらじゅう温度計だらけで、慌ただしい空気が充満していました。各ビールには色違いの 王冠のシールを貼って1区別しました。この実験からーつだけはっきりしたのは……試飲に参 加した人は王冠シールの色を問題にしていて、彼らは黄色の王冠シールのビールを好まなか ったのです。
彼女は小さなビール樽の容量の分析についても述べている。樽は手づくりで、適当なサイズか どうかを判断するために容量を量った。計量に携わる女性は、空の樽と水でいっぱいになった樽 の重さを暈らなければならなかった。もし樽が三パイント以下か七バイント以上で規格外のサイ ズならば、手直しするよう戻される。品質管理プnセスの一環として、統計学者は満杯の樽のサ イズと差し戻された樽を追跡した。
満杯のサイズをグラフにして検証してみると、かろうじて合格とされる樽がきわめて多,く、ぎ りぎり規格外とされたものが非常に少ないことにカンリフは気づいた。そして、計量係の女性の 作業条件を検証した。すると、不合格となった樽を高く放り投げて山積みにし、合格した樽はベ ルトコンべ^-hの上に置くようになっていた。カンリフの提案で、計量場所を不合格の樽置き場 の上へくるようにしてみたところ、不合格となつた樽は、足元の置き場へ蹴ればいいだけになつ た。合格■不合格の境界線上でくぐり抜けるものは減少した。
カンリフはギネス社の統計部門長に昇進した。一九七〇年、彼女はイギリス内務省の調査部門 に引き抜かれ、そこで警察、刑事裁判所、刑務所の指導にあたった"
そこへ加わったとき、この部門は主に犯罪学的な問?に携わっていて、私が踏み込んだと
ころは ギネス社でしてきたような、かなり緻密で入念に計画された、徹底的に分析可能
な研究とは正反対の非現実的としか言いようのない、社会学者か、そしてあえて言わせてもらえるなら、ときに心理学者の世界でした。……少しも内務省調査部門の調査官の能力をけ なしているのではありません。……しかしながら驚いたのは、私が長年やってきた帰無仮説 を立てるところから、入念な実験計画、適切なサンプリング、細心の統計分析、詳細な結果 の評価にいたるまでの理念がまったくおざなりにされ、社会学的な分野が帽を利かせている かのようだったのです。
犯罪学的r研究」はかなりの量があり、長年にわたってデータを蓄積し、それを公共政策の果 たしうる効果として検証することが行われていた。こうした分析の一つに、成人男子の囚人を対 象とした刑期の長さと、釈放からニ年以内にふたたび有罪判決を受ける割合とを比較したものが あった。結果は明らかで、刑期の短い囚人の再犯率がきわめて高かった。これは刑期が長いと路 上から「常習」犯を連れ去るという証拠だとされた。
ヵンリフは再犯率と刑期の単純な表に納得しなかった。表の背後にある元データを注意深く調 べたがった。;見、強い相関関係があるように見えたのは、大部分が刑期1;::.:ヵ月以下の囚人によ る再犯率の高さだつた。しかし、さらに入念に検証してみると、こうした囚人のほとんどすベて がrみな、老いぼれた、もの寂しげで正気を失った人たちであり、精神病院で受け入れてもらえ ずに、結局は刑務所行きとなる。彼らはくるくる回る旅一座のよう」であった。実際、こうした 人たちがたび.たび刑務所送りとなるせいで、同じ人物がくり返し刑務所にやって来ても、表作成 上は、別の人物として数えられていたのだ"再犯に対する長期刑のうわべだけの効果以外に
の他方では、刑期が一〇年以上の囚人では再犯率が一五%以下になっていた。「これもまた年齢 要因が大きく関わっている」と彼女は記していて、「大きな環境要因があり、犯罪の性質にも大 きな要因がある。大がかりな詐欺罪と偽造罪は刑期が長くなりやすい??だが、一度大きな詐欺 罪を犯した者はめつたにほかの犯罪を犯すことはない」。こうして一:つの極端な変則性を踏まえ て表を調整したことで、刑期の長さと再犯とのあいだのうわべだけの相関関係は消滅した。
彼女はこう述べている。
私はいわゆるr古くて冴えない内務省の統計学」でさえ魅惑的だと思っています。……統 計学者の責務の一つは図表の考察にあり、それがなぜそのように見えるのかを問うことだと 私には思えるのです。……今夜はあえて単純に徹しようとしていますが"図表というものは 興味深いものだと伝えていくのが私たちの實務だと思います??そして、こう言っても退屈 そうにしている人がいるなら、それは私たちが無理にわからせようとしてしまつたか、その 図表がおもしろくないかのどちらかの原因であるに違いないのです。内務省内の私の担^す る統計学では、退屈しないと一一Hいたいのです。
彼女は、政府当局者が入手したデー夕を入念に検証することなく決定を下す傾向を非難してい る。
私はこれを社会学者や社会工学者、政策立案者の欠点だとは考えていません……けれども、 少なからず統計学者の責任であることは間違いないでしよう。私たちがこれまで学んできた のは、自らが好むのに比べると科学的ではない理念に仕えるためではありません。それゆえ、 知識を総動員して彼らの助けとなりうる人物として受け入れられてはこなかったのです" ……応用分野における統計学者の強みは、私の経験では……他の人に、答えが必要な疑問を 定式化することを説いたり、これらの疑問が実験者の入手可能なッールで答えられるか考え たり、適切な帰無仮説を立てるのを助けたり、実験計画の厳格な理念を当てはめていく能力 を備えていることです。
私の経験からいうと、数学モデルを使って問題を定式化しようとすることは、実際のところ何 が疑問とされているのか、科学者に理解するよう強いることにほかならない。利用できる手段を 入念に検証することで、それらの手段ではそうした疑問に答えられないという結論に達すること もしばしばある。私がまがりなりにも統計学者として貢献できたのは、適切な手段が揃わないた めに失敗に終わりそうな実験をしないように思いとどまらせたことだろう。たとえば臨床研究で 医学的な疑問が提起されたとして、数百人、数千人もの患者を巻き込むような研究を必要とする ときその疑問に答えるだけの\値があるかどうか考え南すべきである。
抽象数学対役に立つ統計学
カンリフが熱心に説いたのは統計分析をできるかぎり実用的なものとするょう努力すること であった。彼女はただ精巧なばかりの数学のための数学を蔑視し、次のょうに数学モデルを非難 した。
すべてが空想的で、現実とはかけ離れている……抽象の世界は、たくさんの方法、興味深 い側面があり、おもしろ味も十分にある立派な考え方ではあるけれど、しかしまた同時に、 ロバスト性と現実味を欠いているのです。エレガントであることの喜びはしばしば実用性と 引き替えで"あえて言うなら、かなり男性にありがちだと私には思えます。
……私たち統計学者は計算して答えを出す教育を受けてきて 数学的な精密さは持ち合
わせています……(でも)得意ではないのです……初心者に私たちの調査結果を聞き入れて 納得してもらうことにかけては。
ある人に、「P値は0.0〇I以下です」ともったいつけて示したところで、相手がその 意味を理解していなければ、いくらそうしたところでうまくいくはずがありません。ですか ら、私たちはその人に通じる言葉で調査結果を説明し、わかつてもらおうとする力をもつと 身につけていかなければならないのです。
帽子をかぶらず' 醸造責任者におとなしく従ぅことを拒み、ステラ-カンリフは統計学の世界 へと飛び込んだ。旺盛な好奇心が赴くままにさっそぅと、そしてスピーチを聴きにきた数理統計 学の教授たちをチクリと刺しなから、彼女は王立統計学会の会合に出席しては、ぴりっとしたウイットでもって 数学的なてらいを槍玉に?げていた。
うっ血性心不全は世界で主要な死因のーつである。それはしばしば働き盛りの男女を襲うこと もあるが、遐本的には高齢者の病気である。六五歳以上のアメリカ市民のあいだでは、うっ血性 心不全ないしその合併症が死因のほぼ半数を占める。公衆衛生の観点から見ると、うっ血性心不 全は単なる死因だけにとどまらない"それは生活のなかでかなりの病気を引き起こす原因にもな っている"この病気にかかった患者のたび重なる入院や病状を安定させるために行われる複雑な 治療は、アメリカの医療サービスにおける総費用の主要因となっている。入院の頻度を減らし、 また患者の生活の質を改善する効果的な通院治療を見つけることが、きわめて重大な関心事とな
つている。
残念ながら、うっ血性心不全はある一つの伝染性病原体が原因であったり、ある特定酵素の経路を阻喪することで緩和できたりするような簡単な病気ではない。初期症状は、次第に心筋が弱 ることである。身体の変化に応じて心拍数と収縮力を調節しようとするホルモンのわずかな命令 に対しても心臓はなかなか応じられなくなる。そして心筋が肥大し、たるんだ状態になる。血液 が肺と足首に溜まる。患者はちよっとした労作で息切れするようになる。全身に送り出している 血液量が減少することはつまり、食べ物を消化するために胃が血液を要求したときに脳の血液量 が低下することを意味し、患者は頭がほんやりするか、長時間居眠りするようになる。
恒常性を保とうと、患者の生命力は心臓の機能低下に対処しようとする。患者の多くには、い くらかでも安定した状態となるように、心筋やその他の筋肉を調整するホルモン■バランスに変 化が見られ、そのなかのいくつかのホルモンにはそのレベルやそれに伴う反応が「異常」となる 場合がある。この異常なホルモン■バランスに対して医師がタアドレナリン作用薬やカルシウム 拮抗薬を用いて治療すると、患者の状態が改.善することもあるだろう。あるいは、かろうじて安 定していた容態が急変し、治療が患者の容態をさらに悪化させるかもしれない。
うっ血性心不全患者の主な死因の;つは、肺に体液が榴まる(以前は水腫と呼ばれた)ことで あった。現代医療では強力な利尿剤を用いて、この体液レべルを低く抑えている。しかしながら、 この治療過程でこれらの利尿剤は、その薬理作用によって' 腎臓で生成されるホルモンや心臓で 産生されているホルモンのあいだのフィードバックに問題をもたらしてしまうことがあるのだ。
この患者の生命を延ばし、入院の頻度を減らし、生活の質を改善するための効果的な治療法の 研究が続いている。治療法のなかには、一部の患者に逆効果を与えてしまう可能性があるので、これらの治療法の臨床研究はどんなものであっても、患者の特徴を考慮に入れなければならない。 そうすることで、この手の研究から得られたデータの最終分析で治療が効果的であった患者と逆 効果であった患者の確認ができるのだ"うっ血性心不全研究の統計解析ははなはだ難しいものに なりかねない。
このような研究を計画する際の第一の問題は、何を測定するかである。たとえば、ある治療法 について患者の平均入院回数を測定することはできる。これは、患者の年齢、初期の健康状態、 入院の頻度や期間といった重要な側面を外した大まかな尺度である。各患者の病気の時間的経過、 将来の入院の可能性、入院期間の長さ、前の入院からの経過時間、次に入院するまでの生活の質 の尺度、そしてこれらのすべての結果を患者の年齢や罹患しているほかの病気などと合わせて考 え、検討するほうがよりよいだろう。これは医学的観点からすれば理想的だが、統計学的には難 しい問題をもたらす"患者;人ひとりに関するデ?夕が一つではないからだ。患者の記録データ は事象の時間的経過であり、それらの一部はくり返され、またあるものは複数の尺度によって測 定される。この実験の「尺度」は多次元であり、その母数を推定しなくてはならない分布関数は 多.次元構造を持っているのである。
初期の理論研究
この問題の解決はフランス人数学者のポール-レヴィから始まった。レヴィは、祖父と父親がともに数学者である家庭に一八八六年に生まれた。早くから天賦の才ある学生として一認められて いた。当時のフランスで通常のやり方に従って、彼は才能のある学生のための特別な学校に次々 と進み、学業優秀で表彰された。IO代のあいだに全国学力コンクール〔纏^|"§?118〕 のギリシャ語と数学の部門で賞をとった。サン■ルイ高校では数学、物理学、化学で最優秀賞を とり、フランスのエリート養成期間グランゼコールの高等師範学校と理工科学校の入学試験では 首席であったB8I艷?5。
彼はー九ニー年、ニ六歳のときに科学博士号を取得した。彼の博士論文は、抽象的な関数解析 に関する主要な著書のR礎となっている。三三歳になるまでに、理工科学校の正教授と科学アヵ デミーの会員になった。解析の抽象理論についての研究で、彼は世界的に有名になった。一九一 九年、勤務先の学校から確率理論についての一連の講義を準備するょう依頼され、それがこのテ 1マを深く研究するきっかけとなったのである。
レヴィは凝った数え方の集合としての確率論に満足していなかった(アンドレイ-コルモゴロ フの貢献はまだなかった)。レヴィはこれら多くの手法を統合するための基礎となる抽象的な数 学上の概念を探していた。彼は、ド■モアヴルの正規分布の導出と、ド■モアヴルの結果は他の 多くの状況でも成立するに違いないという数学者のあいだで言われた「通俗定理」??「中心極 限定理」と呼ばれるょうになったもの一一に感銘を受けたのである。
一九三〇年代初め、ついにレヴィはフィンランドのリンデべルグとともに、中心極限定理を証 明し、それが成立する必要条件をM定したことは、さきに見てきたとおりである'」そうすることで、レヴィは正規分布の公式を起点として、非常に多くの状況から立ち現れるこの分布に固有の 性質は何か、を逆に問う研究にとりかかった。
そしてレヴィは、正規分布に至る特定の状況は何かを問うというアプローチでこの問題に取り 組んだ。彼はデータが正規分布に従うようになることを保証する、:::つの条件からなる単純な集 合を割り出した。これらのニつの条件は正規分布が生成される唯一の方法ではないが、レヴィの 中心極限定理の証明はかねてから必要とされてきたものより一般的な条件集合を確立したのであ る。これらのニつの条件は、次々とランダムに生成された数の系列があるような状況でも当ては まる。
1それぞれの値が無限に大きくなったり小さくなったりしないように、変動は有界でなくては ならない。
2次(に起こる)の.数の豐の推定量は、直前の値である。
レヴィはこのような系列を「マルチンゲール(martingale)」と呼んだ。
レヴィはギャンブル用語から「マルチンゲール」とい、っR葉を流用した。ギャンブルでマルチ ンゲールとは、ギヤンフラーが負けるたびに賭け金を二倍にする倍賭けのことをいう。もし勝率 が半々なら、その期待損失は直前の損失と等しくなる。
このマルチンゲールという言葉にはほかにニつの意味がある。一つは、フランスの農夫が後ろ足で立ち上がらないように馬の頭をドげさせるための道具である。農夫が使うマルチンゲール (馬具の胸懸)は馬の頭を自山に動かせるようなものであるが、もっとも可能性の高い"将来の 頭の位置"は、いま頭がある場所に落ち着くものである。
この言葉の三番^の定義は海箏用語である。マルチンゲール(垂れ木)は帆桁が片方からもう 片方へ極端に振れないように帆桁から垂れ下げた並い木片のことだ。ここでも帆桁の直前の位置 は次の位置の最良予測となつている。この言葉の由来はもともとフランスのマルテイーグという 町s^の住民にある。マルティーグの住民はヶチで有名で、来週支.払ってくれる小銭は、 よくても今日支払ってくれた小銭程度である。
ゆえにマルティーグのケチな住民は、抽象数学のなかでポール.レヴィが開発した最もケチと 予想される特徴を持つ正規分布になりやすい数列に対しその名前を与えることになった。一九四 〇年までにマルチンゲールは抽象数学理論で重要な手法となった。その単純な必要条件から、多 くのタイプのランダムな数の系列をマルチンゲールと言うことができた。一九七〇年代にノルゥ エーのオスロ大学のオッド■ァーラン(oddAalen)は、臨床試験患者の反応経過がマルチンゲ hルであることに気づいたのである。
うっ血性心不全研究におけるマルチンゲ!ル
うっ血性心不全研究から生じた問題に話を戻そう。傾向として、各患者の反応はそれぞれ異なる。入院のような事態を、この研究の初期に起きたか、もしくはあとに(患者が高齢になったと きに)なって起きたかによって、どのように解釈すべきかという疑問がある。入院の頻度や入院 期間の長さをどう扱うかという疑問もある"長期にわたって得られた数列をマルチンゲールと見 ることで、これらすベての疑問に答えることができる。特に、アーランが記したように、入院患 者は分析から除き、また退院したら戻すことができるのだ。たび重なる入院は、あたかもそれぞ れの入院が新規の出来寧であるかのように扱える。分析者は各時点で、研究に残っている(もし くは戻ってきた)患者数と当初研究に参加した患者数だけを知っていればいいのだ。
一九八〇年の初め"アーランはデンマークのオーフス大学のエリック■アンダーソン(Erik Anderson)、オランダのユトレヒト大学のリチャ一ド*ジル(Richard Gill)と共同研究を行い、 温めてきた着眼点を活かした"本書の第1章で、今日、科学研究や数学研究を単独で行うことは ほとんどないと指摘した。抽象的な数理統計学は桁違いに複雑なので、間違いを犯しやすい。同 僚や研究仲間との議論や批評によってのみ、このような間違いを数多く見つけることができるの だ。アーラン、アンダーソン、ジルの三人よる共同研究は、ニo世紀の最後の 一o年に、この問 題で最も実りある発展の一つをもたらした。
アーラン、アンダーソン、シルの研究は、ワシントン大学のリチャード■オールシュン (Richardolshen)とその共同研究者、ハーバード大学のリー.ジェン.ワィ(Lee-Jenwei)に よって補完され、臨床試験で起きる一連の事象を分析する豊富な新しい手法群を生み出した。と りわけ、L . _―'■ワィは二つのマルチンゲールの差もまたマルチンゲールであるとい、っ事実を利用して、推定モデルの母数を減らした。今日、マルチンゲール■アブnlチは、慢性疾患の長期 にわたる臨床研究の統計解析で支配的な手法となっている。
マルティーグ住民の伝説的なケチが出発点であった。一人のフランス人、ポール*レヴィが他 に先駆けてそれに着?した。数学上のマルチンゲールは他の多くの人々の頭のなかを通り抜け、 アメリカ人、ロシア人、ドイツ人、イギリス人、イタリア人、インド人らによるさまざまな貢献 をもたらした"一人のノルウH?人、一人のデンマーク人、:人のオランダ人はそれを臨床研究 に取り入れた。二人のアメリカ人、その|人は台湾生まれだったが、前の三人の研究を精緻化し た。一九八〇年代末に現れたこのトピックに関する論文や書籍の著者の完全なリストは、多くの ぺージを割くことになるし、またここに挙げた国以外の研究者も数多く含んでいる。まさに開発 現場においては、数理統計学は国際的な研究になりつつあるのだ。
一九八〇年代の初め、イギリスの優れた生物統計学者の一人であるリチャード.ベト (Richardpeto)は問題を抱えていた。彼はがん患者に異なる治療法を施して比較する複数の臨 床試験結果を分析していた"フイッシャーの実験計画法の指示どおりに、典型的な臨床試験では 治療が必要な患者群を特定し、患者たちを異なる治験にランダムに割り当てていた。
そのよぅなデータの分析は、比較的あっさりしているものだが、そぅはいかなかった。五年間 生存した患者の割合をフイッシャーの手法を用いて治療グループごとに比較していた。治療効果 の基本尺度として研究開始から各患者が亡くなるまでの時間を分析するために、アーランのマル チンゲール■アフロ ーチを使つて、より仔朝な比較も行っていた。どちらの方法をとるにしても、 分析は患者の治療を決める最初のランダムな割り当てにかかっていた。フイッシャーの意見に従
第^早治療の意図えば、患者への治療の割り当ては研究結果とは完全に無関係であり、仮説検定のP値を算出でき るのである。
ベトの問?はすべての患者がランダムに割り当てられた治療を受けていなかった点にあった。 多.くは痛みに苦しみながら生きている、末期がんの患者だった。治療を施す内科医たちは、治験 をやめようとか"少なくとも患者の利益になると思えば治験を修正しようと思わずにはいられな かった。患者のニーズや反応を無視して任意の治療に盲従することは、倫理にもとる行為である と。フィッシャーの意見に反し、こういった研究では、患者の反応に応じて治療に選択が働き、 新しい治療を施すことがよくあるのだ。
これはがん研究における典型的な問題だった。こういった研究が一九五〇年代に初めて行われ てからというもの、ずっと問題になってきた。ぺトが姿を現すまでは、ランダムに割り当てられ た治療を受けつづけている患者だけを対象に分析をするのが通常のやり方だった。つまり、他の 患者はすべて分析-Rら除外されたのである。ぺトはこうしたやり方が重大な譯りを弓き起こし力 ねないことに気がついた。たとえば、効果のある積極的な治療と何の生物学的に何の効果もない 偽薬による、プラシーボ治療との比較について考えてみよう。反応のなかった患者は標準的な治 療(?在用いられている治療法)に切り換えるとしよう"プラシーボに反応しなかった患者は、 治療法を変えられ、分析から外される。ブラシーボ治療を引きつづき受けている患者は、他の何 らかの理由により反応のある患者だけなのだ。仮に分析でブラシーボ治療に残った患者とその患 者の反応だけが使われるのであれば、プラシーボ治療が積極的治療法と同等(もしくは、たぶんそれ以上)の効果があることになってしまう。
テキサスにあるM . C ■アンダーソン病院のエドムンド.ゲーハン(Edmund Gehan)は、ぺ トよりも早くにこの問題に気づいていた。当時の彼の解決法は、こういった研究がフィッシャー の要求を満たしていないので、治療の比較実験に役立つとは考えられないと訴えることだった。 それどころか、こうした研究の記録は、異なる治療を受けた患者の綿密な観測記録から成り立っ ていたのである。こうした記録からせいぜい期待できることといえば、治験結果の一般的な記述 であり、将来可能となる治療のヒントを得ることぐらいである。のちに、ゲ}ハンはこの問題に 対して他のいろいろな解決法を模索したが、最初の解法法は、計画や実施がお粗末な実験に統計 解析手法を適用しようとする者の欲求不満を反映したものとなった。
ぺトは簡単な解決法を提案した。患者らは特定の治療を受けるためにランダムに割り当てられ ていた。ランダム化の役割は、これらの治療法を比較する仮説検定のP値が算出できるようにさ せることであるr分析のうえではあた力も各々の患者がランタムに割り当てられた治#をずっ と続けているかのように見なすことをベトは提案したのだった。
つまり、こういうことだ。分析者は研究途中で治療法の変更が生じても、それをすべて無視す ることができるのだ。たとえある患者が治療Aをランダムに割り当てられ、研究終了の直前にそ の治療をやめてしまったとしても、その患者は治療Aの患者として分析される。たとえ治療Aを ランダムに割り盛てられた患者が一週間だけしかその治療を受けなくても、その患者は治療Aの 患者として分析される。たとえ治療Aをランダムに割り当てられた患者が、治療八の薬をー?も飲まずに、研究開始?後に入院して別の治療を受けたとしても、その患者は治療八の患者として 分析されるのである。
このアプローチは一見ばかげているように思えるかもしれない。もし効果がなければ患者を標 準的な治療法に変えるという条件をつけて、治験と標準的な治療法を比較するというシナリオを 考えることができる。そうすると、もし治験の治療法が無効であれば、ランダムにその治療に割 り当てられたすべてないし大多数の患者が標準的治療法に変えられ、二つの治療法は同じ効果で あることがわかるだろう。ぺトが提案のなかで明らかにしたように、実験結果を分析するこの方 法は、治療の効果が同等であることを姑出すために用いることはできない。この方法は効果が異 なることを見出すときに限つて使、っf Jとができるのである。
ぺトの解決法は「ITT (i?uo treat)」法と呼ばれるようになった〔ll^Tiil5£ほ||亡' この名前やこの手法の一般使用を正当化する理由はこうだ。もし所与の治療法の使用を推薦する という医療方針の最終結果に関心があるのなら、内科医にはふさわしいと思う方法に治療を変更 できる自由が与えられなくてはならない。ベトの解決法を用いた臨床試験の分析は、所与の治療 法を治療開始時に推薦することがよい公共政策かどうかを判断することになる。よい公共政策を 決定するために計画された、政府が後押しする大規模研究にとっては、目的にかなったものであ るとして、ITT分析の適用が提案されている。
残念ながら、一部の科学者には背後にある数学を知らないか、あるいは理解しないで、統計手 法を使^-っ傾向がある。この傾向は臨床研究の世界でしばしば見受けられる。ぺトは、自らの解決法に限界があることを指摘した"それにもかかわらず、ITT分析法は、多くの大学で臨床原則 として掲げられるようになり、臨床試験の統計解析において唯一の正しい方法であると見なされ るようになった。多くの臨床試験??特にがんの臨床試験??は、副作用が少ないことが示され ている限り、新しい治療法が少なくとも標準的治療法と同じ効果があることを証明するために計 画されている。多くの治験のR的は、治療の同等性を示すことにあるのだ。ぺトが指摘したよう に、彼の解決法は違いを見つけだすためだけに使うことができ、違いが見つけだせなければ、治 療に同等の効果があるとはいえないのである"
この問題の根源は、ある程度ネイマン=ピアソンの定式化の厳格さにある。統計学の初等レべ ルのテキスト.に見られるネイマン=ピアソンの定式化を標準的に要約したものは、仮説検定を決 まりきった手順として表しがちである。仮説検定の単に恣意的な面の多くは不変なものとして示 されるのだ。
これらの恣意的な要素の多くは臨床研究にふさわしくないとはいえ、.|部の医学者たちが「正 しい」手法を用いなければならないという必要性のために、ネイマン=ピアソンの定式化のなか でもかなり厳格な稱類のものを祀り上げることになった。棄却基準となるP値の値が前もって固 定されず、統計手順によって守られないのであれば、何も受容されない。これが、フイッシャー がネイマン=ピアソンの定式化に反対した一つの理由だったのである。
フイッシャーはP値と有意性検定の使用に際して、そのように厳密な必要条件を前提にしてい るとは考えもしなかったのだ。フイッシャーは特に、ネイマンがあらかじめ判断を誤る確率を決め、P値がその確率より小さいときのみ(意思)決定を行うことに反対した。フイッシャーは自 著『統計的方法と科学的推論』のなかで、どんなP値が有意となるかについての最終判断は状況 に応じてすべきだと示唆している。私が「示唆」という言葉を使ったのにはわけがある。フイッ シャーはどのようにP値を使ったらよいかを決して明快にしなかったのだ。彼は例を示しただけ だった。
コックスの定式化
1九七七年にデイヴイッド.コックス(第23章で登場したボックスとコックスのー方である) はフイッシャ}の議論を取り上げ、それを拡張した。フイッシャーのP値の使用とネイマン=ピ アソンの定式化を区別するために彼は、フイッシャーの手法を「有意性検定」、ネイマン=ピア ソンの定式化を「仮説検定」と呼んだ。コックスが^文を書き上げる時点まで、(P値の使用を 通じた)統計的有意性の計算は科学研究で最も広く使われる手法の一つになっていた。ゆえにコ ックスは、その手法が科学で役立つことが証明されていると結論づけた。
フイッシャーとネイマンの痛烈な論争にも、仮設検定は役に立たないとするw-エドワーズ. デミングのような統計学者の主張にも、P値や有意性の入り込む余地のないベイズ統計学の隆盛にも こういった数理統計学者のあいだでのあらゆる批判にもかかわらず、有意性検定とP値は絶えず使われている。コックスは次のように問うた"科学者は実際にこれらの検定をどのように使っているのか。こうした検定の結果が真であるとか有用であるとかを、どのようにして知る のか。実際には、不必要な母数を除くことで現実の見方を精緻化するために、あるいは?実を説 明するニつのモデルのどちらかに決めるために、科学者は仮説検定を使っていることを、彼は発 見したのである。
ボックスのアプローチ
ジョーシ.ボックス(ボックスとコックスのもう一方である)は若干異なる観点からこの問 題に取り組んだ。科学研究が一つ以上の実験から成り立っていることに注目したのだ。実験にあ たって科学者は力なりの予備知識を有している力もしくは、少なくともどんな結果がMるか の事前予想を持っているものである。研究はそのような知識をより確かなものにするために計画 され、その計画はどのような明確化が求められているかによって決められる??ここまでは、ボ ックスもコックスも同じことを言っている。ボックスにとって、この一つの実験は一連の実験の 一部分にすぎない。この実験から得られるデータは、他の実験から得られるデータと比較される のである。そして事前の知識は、新しい実験と過去の実験の新たな分析の両方から再検討される。 より新しい研究を用いて昔の研究の理解を深め、確かなものにするために、科学者は過去の研究 にさかのぼることを決してやめはしないのだ。
ボックスのアプローチの一例として、ボックスの主要な革新の一つである発展的操作(EVOP)を利用している製紙会社について考えてみよう。ボックスのEV0Pを使って、製紙会社は 生産実験を導入する。湿度、速度、硫黄分、温度は何通りにも微調整される。その結果、得られ た紙の強度の変化は満足には至らない。満足とはいかないまでも、まだ売れるような製品を生産 する余地はある。
このように微妙に変化を加えてやることで、フイッシャーの分散分析によれば、実験全体の平 均強度がわずかに上がるような異なる実験を提案できるし、強度がわずかながらも上がるよ、っな 方尚性を探すのに新しい生産実験を使うこともできる。£;>0?の各実験段階の結果は、前の段 階と比較される。異常な結果が生じたように見える場合は、再実験される。この手順は永遠に続 く??最終的にr正しい」解などない。ボックスのモデルでは、一連の科学実験はデータの調査、 再調査がくり返され、終わりがない。つまり、最終的な科学的真理は存在しないのである"
デミングの見方
デミングや多.くの統計学者は仮説検定の使用をあからさまに拒否してきた。彼らは、推定法に 関するフイッシャーの研究を統計解析の基礎とすべきだと主張している。推定されるべきものは 分布の母数であり、P値と任意の仮説を通じて母数を間接的に扱う分析をしても無意味だからだ。 こうした考えの統計学者はネイマンの信頼区間を頑なに使いつづけ、結論の不確実性を測ろうと する。ところが、ネイマンUピアソンの仮説検{疋は、彼らの主張によれば、ヵール■ピアソンのモーメント法と並んで歴史のゴミ箱に捨てられるべきものなのだ。興味深いことに、ネイマン自 身、自らの応用論文にP値や仮説検定をめったに使わなかったことは、特筆すべきことだろう。
この仮説検定の拒否とボックスとコックスによるフイッシャーの有意性検定概念の再定式化は、 がんの臨床研究でリチャード.ぺトが見つけた問題解決法に疑問を投げかけるものかもしれない。 だが、彼が直面した基本的な問題はまだ残っている。治療の結果によって治療法の変更を許容す ることで、実験が修正されたらどうすればよいのだろうか。これに対してアブラハム.ワルドは、 ある特定の修正を行うとどのように逐次解析が導かれるかを示した。ベトのケースでは、がんの 専門医はワルドの逐次解析法に従っていない。彼らは必要だと感じたときに、異なる治療法を加 えてしまつているのである。
コクランの観察研究
ある意味で、これはジョンズ-ホプキンス大学のウイリアム■コクランが一九六?年代に扱っ た問題である。ボルチモア市は、公営住宅が貧困者の社会的態度や社会発展に影#を及ぼすかど うかを判断したがっていた。市当局は実験の1vち上けに協力してもらえるようション.ス.ホフ キンス大学の統則学グルーブに話を持ちかけた。
ジョンズ*ホプキンス大学の統計学者たちは、フイッシャーの手法に従って、人々を選んで公 営住宅に応募するかどうかを聞き、そのうちの何人かにランダムに公営住宅を割り当て、他の人々には割り当てないことを提案した。これは市当局の反感を買った。公営住宅の公募が始まる と、先着順に割り当てるのが市のやり方であった。それが唯一の公平なやり方だった。市当局は それがコンピュー夕によるランダム化に基づいていても、「真っ先に」やって来た人々の権利を 否定することはできなかった。
しかし、ジョンズ.ホプキンス大学の統計学グループは、いの一番に応幕に駆けつけた人々は しばしば、相当にエネルギッシュで意欲的であると指摘した。もしこれが本当なら、公営住宅に 住む人々は他の人々よりも向上的であるだろう??家それ自体は彼らに何の影響も及ぼさないの である。
コクランの解決策は、■剖画された科学実験を利用することはできない、という提案であった。 その代わり、公営住宅に入居した家族と入居しなかった家族の両方を追うという観察研究を行っ た。各家族ごとに年齢、学歴水準、宗教、安i疋性といった数多くの要因が異なっていた。彼はそ のような観察研究に統計解析を行うための方法を提案した。これらの異なる要因を考慮に入れる ために、任意の家族の測定結果を調整して分析を行ったのである。年齢による影響、家族の欠損 による影響.〔示教による影響などを含め、数学モテルをつくった。これらのあらゆる影#を表す 母数がいったん推定されれば、残った影響の違いが公営住宅の与える影響を判断するために利用 できる。
臨床研究で効果の違いが患者の年齢や性別で調整されることがわかっていれば、研究者は患者 の治療法への割り当てがアンバランスであることを考慮に入れながら、治療の背後にある影響を推定するにあたって多少はコクランの方法を応用することができるだろう。ほとんどすべての社 会学的研究はコクランの方法を用いている。そうした研究を行っている人々は、その方法がゥィ リアム-コクランに端を発していることに気づかないだろうし、具体的な手法の多くはしばしば コクランの研究以前にさかのぼることができる。コクランはそういったものに確かな理論的基礎 を与えた。そして観察研究についての彼の論文は、医学、社会学、政治学、天文学といった「治 療(処理)」のランダムな割り当てが不可能か、もしくは倫理に反するすべての分野に影#を与 えている。
ルービンの方法
一九八〇年代と|九九o年代に、ハーパード大学のドナルド■ルービン(DonaidRubin)はぺ トの問題に対して異なるアプローチを提案した。ルービンのモデルでは、各患者はそれぞれの治 療法に対して何らかの反応があるものと仮定している。もし、二つの治療法があるならば、各患 者は治療法Aと治療法Bのどちらにも何らかの反応があることになる。観察できるのは、患者が いずれかの治療法に割り当てられたあと、その一つの治療法だけを受けている患者である。治療 法ごとの反応を数式中の記'9で表すょうな数学モテルをつくることができるかルービンは患 者がもう一方の治療を施したときに何が起きるかを推定することが必要となるこの数学モデルに ついての条件を導出した"
ルービンのモデルとコクランの方法は現代の統計解析にこそふさわしい。なぜなら、それらは 大量の数値を扱うために、コンピユー夕を利^するからである。もしそれらの方法がフィッシャ hの時代に提案されていたなら、とうてい実行できなかっただろう。このような数学モデルはき わめて込み入っているうえに複雑なので、コンピユータは欠かせないからである。しばしばくり 返し計算の技法が必要となり、その際コンピユー夕は数千ないし数百万の推定を行い、そのたび ごとに得られる推定値が最終的な答えに収束してゆくのである。
こうしたコクランの方法やルービンの方法はきわめてモデル依存的である。すなわち' 現実に 近い説明をするにあたって、複雑な数学モデルを利用することなしに正しい答えを求めることは できないだろう。だから、あらゆる場面、ないし多くの場面で現実に合う数学モデルを考え出す ために分析者(アナリスト)が必要となるのだ。
もし現実がモデルと合っていなければ、分析結果は意味がないかもしれない。コクランやルー ビンのようなアブローチには、結論がロバストとなる度合いを決めるという努力をしなければな らないということだ。現在の数学的な研究は、その結論がもはや真でないという以前に、どの程 度モデルが現実とかけ離れているかを考察している。一九八〇年に亡くなる前' ゥィリアム-コ クランはこれらの問題について考察していた。
統計解析のこれらの方法は、ひとつらなりの同一線上にあると考えることができ、一方の極に コクランやルービンによって提案されたような高度にモデルに依存した手法があり、その対極に 最も一般的なハターンの力たちによつてデ^^タを分析するノンハラメトリック手法^'ある。コンピユータのおかげで高度にモデル依存的な手法が実行可能になったのと同時に、もう片方の極の 統計解析??数学的構造をほとんど、ないしまったく仮定せず、データがモデルの先入観にとら
われずに向らを語ることが許されるノンパラメトリックの極 にもコンピユータ革命が訪れた。
これらの手法は「ブートストラップ(bootstrap)」という奇抜な名前で通っている。次章ではこ れらについて取り上げょう。
グィド.カステルヌオーゥォはィタリアのユダヤ人名家の出身である。祖先は古代ローマの初 代a帝時代までさかのぽることができる。一九;五年にローマ大学の数学科の教授陣に加わった カステルヌォーヴォは孤軍奮闘していた。大学院のプログラムに確率論と保険数理の数学の講義 を導入したいと思っていたのだ。当時は、アンドレィ.コルモゴロフが確^^論の基礎を確立する 前で、数学者たちは確率論を複雑な数え方の技法を使った手法の集まりと見なしていた。それは 数学の興味深い側面であり、しばしば代数の講義の一環として教えられた。だが、燦然と輝く抽 象的な純粋数学が体系化されていた肖時にあっては、大学院のプログラムに含む価値があるとは ほとんど思われていなかった。保険数理の数学に至っては、人の寿命と事故の頻度を比較的簡単 な算数で算出する最悪の芯用数学だった。カステルヌオーヴォ以外の教授たちはそのよぅに信じ
第^早コンピユータは自分自身に向かつマゆていたのである。
代数幾何学の抽象的分野における兜駆的な研究に加え、カステルヌォーヴォは数学の応用に強 い興味を持ち、ほかの教授たちにそのような?義を組み入れることを認めるように説得した"こ の授業を教えた結果として、統計的応用を含んだ確率論の初期のテキストの一つ『確率とその応 用のための計算00^§0^^5'^36&&7ぎ6 0^^^-028-?^』を|九ー九年に出版した。このテ キストはイタリアのほかの大学で開講された同じ講義で使われた。一九二七年までにカステルヌ ォーヴォはローマ大学に統計-保険数理科学科を設立した。また、一九二〇年代からH〇年代を 通じ、高まりつつあった保険数理研究に携わる統計学者のイタリア学派とスゥエーデンの同様な グループとのあいだで活発な交流が行われた。
一九二ニ年、ベニート■ムッソリーニ(BenitoMUSSOUIli)はイタリアにファシズムをもたら し、表現の自由を厳しく統制した。大学では、「国家の敵」を排除するために学生から教授まで もが調べられた。これらの排除には人種的な要素.はなく、カステルヌオーヴォがユダヤ人である という事実は問題にならなかった。ファシスト党政権になつてからも、彼は一一年間その職に とどまることができたのである。一九三五年、イタリアのファシスト党とドイッ■ナチスのあい だに協定が結ばれると、イタリアで反ユダヤ法が制定され、七o歳のカステルヌオーヴォは職を 追われることとなつた。
とはいえ、I九五ニ年まで生きた不屈の男の経歴が終わったわけではなかった。ナチスに吹き 込まれて成立した人種法によって、多くの将来有望なユダヤ人大学院生もまた大学を追われた。
そうした大学院生が研究を続けられるように、カステルヌオーヴォは自宅や他のユダヤ人の元教 授たちの家で特別授業を組織した。数学史に関する本の執筆に加えて、八七年にわたる生涯の? 年を決定論主義と偶然主義との哲学的関係を調べることや、原因と結果の概念??前章で触れ、 次章でさらに考察するトピックス の解釈を試みることに費やしたのである。
カステルヌオーヴォの努力によって生まれたィタリア学派統計学は、確固とした数学的基礎が ありながら、研究の出発点の多くは現実の応用から得られた問題を扱った。カステルヌオーヴォ より若い世代のコッラド.ジニ001:3&92.)は、ー九:::六年ローマに設立された中央統計局 (現在の国家中央統計局ISTAT)の初代所長になった。ジニのあらゆる穂類の応用に対する 旺盛な関心は、一九三〇年代に数理統計学に携わった多くの若いィタリア人数学者たちの接触を もたらした。
グリヴェンコ=カンテリの補題
そんな若い数学者の一人がフランチェスコ*パオロ*カンテリ(Francesco F*aolo cantali)だ った。一八七五年生まれの彼は、確率論の基礎構築でコルモゴロフに先んじていた。カンテリは 基礎的問題(確率の意味は何かというような問題を扱うこと)の研究には関心がなく、背後にあ る理論にコルモゴロフと同じくらいのめり込みはしなかつた。
一八世紀にアブラハム.ド■モアヴルが確率計算に代数学の方法を導入して以来、普及してきた確率計算のかたちに基づいて基礎的数学理論を展開することにカンテリは喜びを見出していた。 一九一六年、カンテリは数理統計学の基礎理論と呼ばれるものを発見した。その重要性にもかか わらず、「グリヴHンコ=カンテリの補題(Glivenko-canteliilemmaごという控え目な名称で通 っている。カンテリはその補題を証明した最初の人であり、その重要性を十分に理解していた。 一方、コルモゴロフの学生の一人ヨゼフ*グリヴェンコ(JosephGlivenko)は、部分的ながら その功績を認められている。というのも"「スティルチェス積分(stieltjes integral)」という新 たに開発した数学記法を用いて、一九三三年に(イタリアの数学学術雑誌に)発表したカンテリ の論文結果を一般化したからだ。グリヴェンコの記法は現在のテキストで最もょく用いられるも
のの一つである。
グリヴェンコnカンテリの補題は、直観的に明らかだと思えるょうな結果の一つだが、それは 発見されたあとだからこそ、そう言えるのである。もしデー夕がもたらされる背後に確率分布が あることなど何もわかつていなくても、データそれ自体を用いてノンパラメトリックな分布を描 くことはできる。これは不連続で気品のかけらのなさばかりが目立つ醜い数学関数の;つである。 だが、その不恰好な構造にもかかわらず、観測値の数が増えれば増えるほど、この醜い経験分布 関数が真の分布関数にますます近づくことをカンテリは証明することに成功した。
グリヴヱンコ=カンテリの補題の重要性はすぐに認知され、その後ニ〇年間にわたってこの補 題がくり返し使えるょうに:1:夫することで、数多くの重要な定理が証明されてきた。それは、証 明の際にほぼ必ず用いられる数学上の道具の一つであった。この補題を用いてM〇世紀前半の数学者たちは、数え方の技法の巧妙な操作を生み出さねばならなかった。
経験分布関数をつくることは、単純計算のくり返しである。複雑な計算方法でなくても、標本 サィズの大きいデータセットから母数を推定するのに経験分布関数を使えば、すばらしいコンビ ュータが何百万もの作業を一秒で行ってくれる。そんな懺械は一九五?年代や六o年代、さらに 七〇年代ですら存在しなかった。一九八〇年代になって、コンピュ^^タはこれを実行できる水準 にまで達したのである。グリヴHンコ=ヵンテリの補題は、高速コンピュータの世界でのみ?在 できる新たな統計手法の基礎になったのである"
エフロンの「ブートスラップ法」
一九八ニ年にスタンフォー^^学のフラッドリ^? ■エフロンが「フートストラッフ法」を発明 した〔Ifug^slf1l^sfs;l^fsl-丸〕。それはグリヴェンコ=ヵンテリの補題の:::つの簡単 な応用に基づいている。その応用は概念的には単純だが、計算、再計算、再々計算を行うために コンビュータを相当に使う必要がある。それほど大きくない標本数のデータセットに典型的なブ ?トストラップ分析を行うと' 超高性能コンビュータでも数分間はかかる。
まるでフーツのつまみ革(フートストラップ)を自分でつかんで自分を上へと弓っ張り上ける
^つまり自力で^境を乘り切るの意 Hうなテータのケースであること力らエフロンは
この手法をブートストラップと名づけた"それはコンビュータが単純計算のくり返し作業を面倒だと思ったりしないからうまくいくのである。コンピユータは同じ計算を何度も何度もくり返し ても文句を ー@わない。現代のトランジスタべjスの集積回路を使えば、数マイクロ秒でそのよう な作業をするのだ。
エフロンのブートストラップ法の背後には、いくつかの複雑な数学が存在する。彼のオリジナ ルな論文で証明しているのは、もしデータ生成の背後にある真の分布についてある種の仮定が満 たされていれば、この手法が標準的な手法と同等だということである。この手法が及ぼした影響 は広範囲にわたり、一九八ニ年以降、数理統計学の学術誌のほぼ?号にブー卜ストラップ法に関 する論文.がー本以上掲載されるようになっている。
リサンプリングと他のコンピユー夕集約的手法
ブートストラップ法には変形版やそれに関連した手法があり、一般的にそれらはすべてリサン プリングという名前で通っている。実際、エフロンはフイッシャーの標準的な統計手法の多くが リサンプリングの形式と見なせることを明らかにしてきた。同様に、リサンプリングは「コンビ ユ?タ集約的手法」と呼ばれる、より多.方面にわたる統計手法の一部になっている。コンピユー タ集約的手法は現代コンビユー夕の処理能力を使いこなして、同じデータを何度もくり返し研究 しながら莫大な量の計算をさせるのである。
一九六〇年代にカリフォルニア大学'ハークレー校のマ}レイ.ロ jゼンブラット(Murray)とアィ才ワ州立大学のエマニユエル.パルゼン(1311:1111£111!=;61^甬2611)がそれぞれ独 自にそのょうな手法の一つを開発した。彼らの手法は「力ーネル密度関数推定法」として知られ ている。ヵーネル密度関数推定法は、次いで力ーネル密度関数べースの回帰モデル推定法をもた らした"これらの手法は「ヵーネル」と「バンド幅」という二つの任意の母数を含んでいる。こ ういった考え方が現れてからまもなく、(コンピ.ユー夕がその能力を最大限に活かすことができ るほど高性能になるはるか前の)一九六七年にコロンビア大学のジョン■ヴァン?ラィゼン (JohnvanRyzin)がグリヴェンコ=ヵンテリの補題を使って、これらの母数の最適な値を求め た。
数理統計学者が理論をつくり出し、それを自分たちの分野の学術誌に発表していた一方で、ロ 1ゼンブラットとパルゼンの力ーネルべースの回帰は工学分野の世界でも独自に発見されていた。 それは、コンピユータ技術者のあいだで「ファジー近似」と呼ばれているもので、ヴァンラィゼ ンが名づけた「非最適ヵーネル」を使い、かなり恣意的にバンド幅を一つ決める"工学の現場で は理論的にみて最良な手法を追求することが問題なのではなく、使い物になるかどうかが重要な のである。理論家たちが抽象的な最適化基準に頭を悩ましているあいだに、技術者たちは実世界 に出てフアシー近似を使つてコンヒユータぺ^^スのフアジー■システムをつくり上けた。この ファジー学システムは、焦点や絞りを自動調整する全自動ヵメラに使われており、また部屋ご とに異なる快適な温度を一定に保つために新しい建物でも使われている。
民間の;.[:学コンサルタントであるハート.コスコ9'£≫3.'1^0^0)はファシー-システムの普及に最も貢献した者の一人である。彼の本の参考文献に目を通すと、確率過程理論とその工学へ
の応用に貢献した数理統剖学者ノー'ハ ^ .ゥイーナーの文献に加えて、コッドフライド*ゥイ
ルヘルム-フォン.ライプニッツ(Gottfried wuhamvon Leibniz)のような一九世紀の主流であ った数学者の文R'-を見つけることができる。ローゼンフラットハルゼン、ヴアンライゼンやそ の後力ーネルべースの回?理論に貢献した人々の文献は見当たらない。フアジー.システムと力 1ネル密度関数べースの回帰は、コンピユー夕のアルゴリズムとしてはほぼ同じものになつてい るが、互いにまったく独立に開発されてきたように思える。
統計モデルの勝利
標準的な工学の現場への、コンピユータ集約的手法のこうした広がりは、いかに科学における 統計革命がニ〇世紀の終わりまでにいたるところで起きていたかを示す一例である。もはや数理 統計学者は、手法の開発にあたる唯一の人間でも、最も重要な人間でもない。過去七o年以上に わたって数理統計学分野の雑誌に発表されてきた多.くのすばらしい理論が、科学者や技術者の知 るところではないとしても、そういった理論を彼らは使っているのである。最も重要な定理は、 しばしばくり返し発見されるのだ。
時として、基本的な定理の誤りが立証されなくても、使用者が直観的に正しいように思えるの であれば、その理論は正しいものと見なす。稀にではあるが、誤っていると証明されてきた定理を使うこともある。あらためて、その理論が直観的に正しいと思えるのであればだが。これは、 確率分布の概念がかなり現代の科学教育に浸透してきたことで、科学者や技術者が分布を用いて 考えるようになったためだ。
一〇〇年以上も前に力ール'ピアソンが提案したのは、すべての観測値が確率分布に起因する ことや科学の目的がそれらの分布の母数を1定することだつた。それ以前は、宇宙はニユート ンの運動法則のような法則に従っており、観測されたものの明らかな違いは誤差によるものと科 学の世界では信じられていた。次第にピアソンの見方が優勢を占めるようになってきた。結果と して、ニo世紀に科学的方法のトレーニングを受けた人は誰でもピアソンの見方を当然のものと して受け止めている"現代科学のデータ解析法があまりにもしっかり浸透しているので、あえて はっきりと口にする必要などないのだ"今の科学者や技術者の多くは、この見方の哲学的な影響 など考えることなく、これらの手法を用いているのである。
確率分布が科学の解明する真の「事柄」であるという概念が広まるにつれて、哲学者や数学者 は深刻な遲礎的問題があることを明らかにするようになった。これまでの章でそれらのいくつか を、折に触れ考察してきた。次章ではこれらの問題に真正面から取り組むことにしよう。
一九六:一年にシヵゴ大学のトーマス■クーン(ThomasKuhn)は著書『科学革命の構造(77W Structure of Scient'slc^aevoh/Mons)』を出版した。この本は、哲学者と実務家の両方の科学観 に重大な影#を与えてきた。ク?ンは、現実はきわめて複雑であり、系統立った科学的モデルに よって完全に説明されることは決してないと指摘した。また、科学は利用可能なデータが当ては まるような現実性を持つモデルをつくり出そうとしがちであり、新しい実験結果を予測するのに も役立つ、と提起した。完全に真といえるモデルなど存在しないので、新しい発見に応じてデー 夕の蓄積はモデルに修正を加えなくてはならなくなった。モデルはますます複雑になり、特別な 例外や直観的に信じがたい拡張を伴うようになった。実際、モデルはもはや役立つという意味で 目的にかな、っものではない。そんなときに、独創的な思想家がこれまでとまったく異なるモデル
第^早隱れた欠点のある祟#物を持って現れ、科学に革命を巻き起こすのだろう。
統計革命はこのモデル転換のI例である。一九世紀の科学の決定論的な見方によれば、ニユー トン物理学は惑星、月、小惑星、彗?の運動をうまく説明してきた。それらはすべてニ、7::;の明 確な運動法則と重力に基づいているのである"化学法則の発見に多小ノは成功したし、ダーゥィン の自然淘汰説は進化の理解に役立つきっかけをもたらしたように思える。科学法則の探求を社会 学、政治学、心理学の領域にまで広げようという試みさえあった。当時、これらの法則を発見す るにあたっての大きな問題は、測定が精緻でないことにあると信じられていた"
ピエール.サィモン.ラプラスのような一九世紀初めの数学者は、天文測定には、大気状態や 観測者の人為的ミスによると思われる若干の誤差が含まれているという考え方を展開した。これ らの誤差が確率分布を持つという提案をすることで、統計革命の扉を開いたのである。クーンの 見方を用いれば、これは新しいデータによって必然的に生まれた時計仕掛けの世界の修正だった。
一九世紀のベルギーの博学者ラン、ハート-アドルフ-ジャック■ケトレー(Lambert Adolphe JacquesQetelet)は、人間行動の法則は本質的には確率的であると提案し、統計革命を予見した。 ケトレ?は力ール-ピアソンの複数母数アプローチを採用しなかったし、最適推定手法の必要性 にも気づいていなかった。また、彼のモデルはかなり初歩的なものであった"
結局のところ、科学の決定論的アプローチは破綻した。モデルの予測と実際の観測との差異が、 観測が精緻になるにつれて、より大きくなったからである。ラプラスが惑星の真の運動を観測す る際に障害になっていると考えた誤差を取り除く代わりに、より精緻な観測はより大きな変化をもたらすこととなつた。この点で、科学は力ール-ピアソンと彼の母数を伴う分布を迎える準備 ができていたのである。
本書のこれまでの章で、いかにしてピアソンの統計革命が近代科学のすべてに広がっていった かを明らかにしてきた"遺伝子が細胞に特定のたんぱく質を生成させる原因を突き止めた分子生 物学の明らかな決定論主義にもかかわらず、この科学から得られた現実のデータはランダム性に 満ち溢れており、実のところ遺伝子はこれらの結果の分布の母数である。現代の医薬の身体機能 に対する効果は' 一ないしニミリグラムの用量で血圧や神経症に重大な変化をもたらすように、 確かに存在するように思える。しかし、これらの効果を証明する薬理学研究は確率分布を用いて 設計■分析され、それらの効果はそういった分布の母数となるのである。
同様に、計量経済学の統計手法は国家や<止業の経済活動をモデル化するために使われる。われ われが電子や陽子と確信している素粒子は、量子力学では確率分布として表される。社会学者は 個々の相瓦作用を説明するために、集団についてとった平均の加重和を導いた!,...-だがそれは、 確率分布によってのみである。これらの科学分野の多くにおける統計的モデルの使用は、その方 法論の大部分を占めているので、分布の母数はあたかもそれが実際に測定可能なものであるかの ように思われている。これらの科学の出発点である測定の移行や変化といった不確実なものの集 ま.りは計算のなかに隠れ、結論は決して直接観測することのできない母数によって述べられるの である。
制御力を失った統計学者
統計革命が?代科学にあまりにもしっかり根づいたために、統計学者はその進展をコントロー ルできなくなった。分子遺伝学者による確率の計算は、数理統計学とは一線を画して発達してき た。情報科学といぅ新しい専門分野は、大量のデー夕を蓄積できるコンピユータの能力から、ま たそぅした巨大な惰報のラィブラリの意味を理解する必要性から生まれた。情報科学の新しい学 術雑誌の論文では、数理統計学者の研究が引用されることはめったになく、何年も前にバィオメ トリ力誌や数理統計学論集誌で考察された分析手法の多くが再発見されている。公共政策の問題 に対する統計モデルの応用は「リスク分析」と呼ばれる新しい専門分野を生み出したが、リスク 分析の新しい学術雑誌もまた、数理統計学者の研究を省みない傾向にある。
ほとんどすベての専門分野の科学雑誌は、今や結論を出すにあたって、統計的不確実性の何ら かの尺度を含む結果表を要求する。また、統計解析の標準的な方法は、大学においてこれら諸科 学の大学院課程の一環として教えられている"だが通常、同じ大学に統計学科があったとしても 関与することはない。
力ール*ピアソンによる歪んだ分布の発見から一〇〇年以上のあいだ、統fl革命は科学の大多 数の分野に広がっただけでなく、その考え方の多くは凹間一般の文化にも行き渡った。テレビの ニユjス.キャスタ?が、たばこを吸わない人が受動喫煙によって「死亡リスクが二倍に高まる」ことを示した医学研究を伝えたとき、ほとんどすべての視聴者はその意味を理解しているだ ろう。世論調金で六五%プラス-マィナス三%の市民が大統領は職務を立派に遂行していると考 えていることが判明したとき、われわれは六五%と三%のどちらの意味も理解していると多くの 人は思っている。天気予報で明日の降水確率が九五%と予測されれば、大半の人が傘を持って出 かけるはずだ。
その意味がわかっているかのように確率や割合を使うわりには、統計革命は世間!般の考え方 や文化にわずかな影響しか与えてこなかった。たとえ実際の観測で完全に一.致しなかったとして も、われわれは母数の推定に基づく科学的研究の結論を受け入れる。データの平均をとって公共 政策を決定しようとしたり、個人の剖画を立てようとしたりする。死亡と出生のデータを集める ことは、それが法的に適切な手続きであるだけでなく、必要なものであるから当然のことと考え る。また、人|.:.[調査で神の怒りを買う恐れもない。言語のレべルでは相関とか相関したという言 葉をあたかもそれらが何かを意味し、その意味を理解しているかのように用いているのだ。
本書はこれまで数学者でない人々にこの革命が何であるかについて説明しようとしてきた。私 はこの革命の背後にある本質的な考え方を描こうとしてきた。どのようにして科学のさまざまな 領域で使われるようになり、どのようにして科学のほぼすべてをついには席捲するようになった のか。抽象的な数学記号という高いUをよじ登ることなく理解できるように、言葉や例を使って いくつかの数学モデルを解釈しようと試みたのだ。
統計革命は行き着くところまで行つてしまったか
世の中はきわめて複雑な感覚、出来事、騒動の塊である。トーマス■クーンをもってしても、 世の中にあるのが実際に何であるかという説明に近づくような思考体系を人間の頭脳が構築でき るなどとはとうてい思えない。そのようなどんな試みも基本的に誤りをはらんでいる。結局のと ころ、これらの誤りはあまりにも明白なので、科学的モデルは絶えず修正され、より巧妙なもの へと取って代わられなければならない"最終的には統計革^tは行き着くところまで行って、何か ほかのものに取って代わられることが予想できるのだ。
本書を終えるにあたって唯一の理にかなったやり方は、統計手法が人類の活動のより多くの分 野に広がるにつれて生じた、哲学的問題に対する議論のいくつかに触れておくことだろう"これ から話すことは哲学にとってIつの冒険となるに違いない。読者は、どんな哲学が科学や実生活 と関係があるのか疑わしく思うかもしれない"
それに対する私の答えはこうだ。哲学は、哲学者と呼ばれる一風変わった人々による深遠な学 問的練習などではない。哲学は日々の文化的思想や行動の背後に潜んでいる仮定を考察するので ある。われわれが自らの文化から学んだ世界観は、ちよっとした仮定に支配されている。そのこ とに気づいている人はほとんどいない。哲学研究はこうした仮定を暴き出し、その正^性を検討 することにある。
私はかつてコネチカット-カレッジの数学科で講義を受け持っていた。.その講義には正式な名 前がついていたが、学科の人々はそれをr詩人のための数学」と呼んでいた。教養専攻の学生に 数学の本質的な考え方を理解させるために企画された半期の授業だった。
学期の初めのほうで、一六世紀のィタリアの数学者ジローラモ.カルダーノ (Girolamo Cardano)の『大いなる術C42を学生に紹介した。『大いなる術』は新たに登場した 代数の諸手法を説明した初めての本である。大著をそのまま伝えると、カルダ?ノは序章のなか で、この代数は真新しいものではないと記している。つまり彼は、自分が無知なばかではないと 昭に句わせているのだ。アダムとィフの堕落以来、知識は減少しつつけており、カルダーノの時 代に生きていた誰よりもはるかに多くのことをアリストテレスは知っていたことに気がついてい た。新たな知識が存在しないかもしれないことに気づいていたのだ。しかし、彼の無知のために アリストテレスのある考え方についての文献を見つけること力できずにその考え方をあた力も 新しいものであるかのように読者に紹介したのである。カルダーノは新しいように見えるこの考 え方を、もっと博学な読者が実際に先人の著作のなかから見出し、位置づけし直すだろうと確信 していた。
新しいことが発見できると信じているだけでなく、実際に技術革新を奨励する文化環境のなか で育った私の授業の学生たちにとって、これは衝撃であった。なんて愚かなことを書いているの かh一iハ,紀にはョhロッハ人の世界観が$本的な哲学上の仮定によって縛られていたことを 彼らに指摘した。ョーロッバの世界観の重要な部分は、アダムとィブ(すなわち人間)の堕落と、その結果として世界??倫理、知識、産業、あらゆること^-が退歩してゆくという考え方に基 'づいていた。これは真実であると思われていたし、それゆえ、めったにはっきり述べられること もなかった。
私は、世界観の背後にあるどのような仮定が五00年後の将来、ばかげたことに思えるだろう か、と学生たちに尋ねた。彼らは何も思いつかなかったのである"
統計革命の表層的な考え方が現代文化へと広がってゆき、ますます多くの人々がその背後にあ る仮定について考えることなく真理と思うようになった。そこで宇宙の統計的な見方における,三 つの哲学的問?を考えてみよう。
1意思決定に統計モデルは利用できるのか?
2実生活に応用する際、確率の意味は何だろうか?
3人々は本当に確率を理解しているのか?
意思決定に統IIモデルは利用できるのか
オックスフォード大学のジョナサン■コーエン(L. Johathan Cohen)は、自ら「パスカル的」 見方と名づけたもの、すなわち現実を説明するために統計分布を用いること、について痛烈な批 判をしてきた。一九八九年の著書『帰納と確率の哲学入門{Atz 7nfro dsas-n&^e p/?s.osop0fInduction and Probability) }のなかで彼は、コネチカット州ミドルタゥンにあるゥェズリア ン大学のセイモア■カイバーグ(seymourKyberg)による、くじの逆説を示している。
われわれが仮説検定ないし有意性検定の考え方を受け入れると仮定しよう。もし仮説が成立す る確率がとても小さければ、その仮説を棄却するという決定を下すことにする。具体的に、〇- ? o〇一というとても小さい確率を設定する。今、一万枚の連番の券を用いた公正なくじをつく るとしよう。番号「1」のくじ券が当たるという仮説を考えると、その確率は0■〇〇?一なの で、その仮説は棄却される。
次に、番号「2」のくじ券が当たるという仮説を考えよう。この仮説もまた棄却される。特定 の番号がついたくじ券が当たるという同様の仮説は,棄却される。論理則のもとでは、もしAが真 でなく、かつBが真でなく、かつCが真でないとき、AないしBないしCは真ではない。すなわ ち論理則のもとでは、もし各々の特定のくじ券が当たりでなければ、どのくじ券も当たりではな いことになる。
それ以前に著した『確からしさと立証可能性(me Probable ancU/ie provable)』のなかで、
L . J■コーエンはこの逆説を法律実務の現場に基づいた例に変えて示している。イギリスやア メリ力の慣習法では、民事訴訟の原告は、もしその主張が証拠の「優勢」に照らして正しいと思 われれば勝訴する"このことが原告の主張が五〇%より大きい確率であることを意味することは、 裁判所も受け入れている。
コーエンは不正入場者の逆説を提示している。一〇〇〇席のホールで開催されるロック*コンサートを考えてみよう。プロモjタj (興行、王)は四九九席のチケットを?ったがコンサート が始まったときには一〇o?席すベてが埋まっていた。ィギリスの慣習法に従えば、コンサI-r で 一o〇〇人の観客からそれぞれ料金を取り立てる権利がある。なぜなら観客の一人が不正入場 者である雍甲は五0-ー°/0だからである。ゆえにフロモーターは|〇〇0席しかないホールに対 して、一四九九人分の料金を取り立てることができるのだ。
この二つの逆説は、確率的主張に基づく意思法定が論理的な意思決定ではないことを示してい る。論理的+:張と確率的主張は相容れないものなのである。フィッシャーは十分に計雨された実 験に基づく有意性検定を訴えることで、科学における帰納推理を正当化した。コ?エンの逆説は、 そのような帰納推理が論理的でないことを示唆している"ジエローム■コーンフィールドは次々 と、喫煙が肺がんを引き起こす原因であると仮定せずにはとても起こりそうにない研究結果を示 し、そうした証拠を積み重ねて訴えることで、喫煙が肺がんを引き起こす原因であることの発見 を正当化した。喫煙ががんの原因であると信じることは非論理的だろうか。
n1エンの逆説に仮定の欠陥を見つけても、論理的決定と統計的決定が合致しないことの説明 にはならない。それは論理が意味することの核心にある。コーエンは確率モデルが「様相論理」 として知られる洗練された数学論理に取って代わられることを示したが、この解決策がそれによ って解決するものよりも、さらに多くの問題を招いてしまうと思う。
論理学においては、真である命題と偽である命Rのあいだには明確な違いがある。だが確率で は、命題がたぶん真であるとか、ほとんど真であるという考え方を持ち込むことになる。その結果生じたちょっとした不確実性は、原因と結果を扱う際に冷静な厳格さを持って実質含意を捉え ようとするわれわれの能力を阻害する。
臨床研究において、この問題に対し提案された解決法の一つはこうだ。それぞれの臨床研究を 所与の治療の効果について何らかの情報を提供するものとして姑なすことである。そうした情報 の価値はその研究の統計解析によって決定されるが、同様にその研究の質によっても決定される。 研究の質という追加的な尺度は、どの研究が結論を導くう£で優位であるかを決定するのに使わ れる。研究の質という概念はあいまいなものであり、簡単には計算できない。この逆説は統計手 法の核心をむしばみつづけている。この不一致という虫はニー世紀に新たな革命を必要とするだ ろうか。
実生活に応用する際の確率の意味は何だろうか
アンドレィ.コルモゴロフは確率の数学的意味を次のように規定した。確率は抽象的な事象空 間における集合の測度である、と。確^についてのあらゆる数学的性質はこの定義から導かれる。 実生活で確率を応用したいと思えば' ある問題に対する抽象的な事象空間をすぐに特定する必要 がある。天気予報士が明Rの降水確率は九五%であると言ったときに、測定される抽象事象の集 合は何だろうか。それは明H外出する予定のあるすベての人々の集合であって、その九五%が雨 に濡れるということだろうか。それは時間を瞬間ごとに分割したものすベてからなる集合であって、その九五%において雨に遭遇するということだろうか。それとも、ある地域を;平方インチ に分割したものすベてからなる集合であって、その九五%が雨に濡れるということであろうかC もちろん、そのどれでもない。では、いったい何なのだろうか。
コルコモロフが登場する前、力ール■ピアソンは大Mのデータを収集することによってよう やく確率分布が観測可能になると信じていた。われわれはそのようなアプnlチを使って問題を 扱ってきた。
ゥイリアム.S .ゴセットは、計画された実験に対して事象空間を表?しようとした。彼は、 事象空間はその実験で起こりうる結果のすべてからなる集合であると言った。これは知的には満 足できても、使いものにはならない。統計解析を行うのに必要な確率を計算できるよ、っに、かな り厳密に実験結果の確率分布を表現する必要がある。起こりうる結果すベてからなる集合という あいまいな考え方から、どのようにして特定の確率分布を導くのだろうか。
フイッシャーは当初ゴセットの定義に同意していたが、その後、よりふさわしい定義を生み出 した。彼の実験計画では、処置はランダムに実験ユニットに割り当てられる。動脈硬化のある肥 満のラットに施す二つの治療を比較したいと思えば、何^かのラットに治療Aをランダムに割り 当て、残りのラットに治療Bを割り当てる。その研究は実行され、その結果を観察する。どちら. の治療も基本的には同じ効果があるとしよう。治験動物はランダムに治療を割り当てられている ので、割り当てが変わっても同じ結果が得られるだろう。
治療のラべルがランダムに変わることは、動物に問違つたタグがつけられることと同じである
??治療が同じ効果を持つ限りにおいては。ゆえに、フイッシャーにとって事象空間は、考えら れるすべてのランダム割り^てからなる集合なのだ。これは有限の事象集合であり、すべての事 象が等しく起こりうる。ニつの治療が同じ効果を持つという帰無仮説のもとで、得られる結果の 確率分布を計算することができるょうになる。これは「並べ換え検定(permutationtest)」と呼 ばれている。フイッシャーかこの検定を提案したとき、考えられるすべてのランダムな割り当て を数えることはできなかった。フイッシャーは自ら発明した分散分析の式が正しい並べ換え検定 のょい近似になつていることを証明したのである。
それは高速コンビユータが登場する前のことだった。今や並べ換え検定を実行することが可能 になり(簡単な算数をすることになつてもコンビユータは疲れを知らない)フイッシャーの 分散分析の公式は必要ない。長年にわたって証明されてきた数理統計学の巧みな定理の多くもま た必要ではなレ。データがランダム化された制御実験力ら得られたものである限りすベての有 意性検定はコンピユータを使った並べ換え検定で行うことができる"
有意性検定が観測データに対して行われるときには、こゝっいったことはできない。これは、フ イッシャーが喫煙と健康に関する研究に反対した主な理由である。研究者たちは自分たちの症例 を証明するために統計的有意性検定を用いた。フイッシャーにとって、ランダム化実験とともに 行わない限り、統計的有意性検定は不適切なものになってしまう。
アメリヵの法廷での差別訴訟は、統計的有意性検定に基づいて判定されることが日常的になっ ている。アメリヵの連邦最高裁判所は、これが性的ないし人種的差別にょる隔離の影響が存在するかどうかを判定する、:つの容認できる方法であると規定してきた。生きていればフイッシャ 1は火声を上げて反対したことだろう。
;九八〇年代末に、アメリヵ科学アヵデミーは法廷での証從に統ti手法を採用することについ ての研究を後援した。力ーネボ?H メロン大学のステフアン.フイエン'ハーグ(Stephen ^$&6^)とミネソタ大学のサミユエル.クリスロフ(831111:161&5;-0<)が委員長となって、研 究委員会はー九八八年に報告書を提出した。喫煙ががんを9|き起こす原因であることの証明にフ イッシャ?が異論を哨えたときと同じ論調で、その報告書に収録された論文の大半が差別訴訟で 仮説検定を用いることを批判した。もし最高裁が訴訟において有意性検定を是認したいと考えて いるなら、確率を生成する事象空間を特定すべきなのである。
コルモゴロフの事象空間をMつける問題の二つめの答えは、標本調査理論のなかに見ることが できる。われわれが何かを決めるために母集団のランダム標本をとろうとするときには、調べよ うとする人々の母集111をきちんと特定し、杣出方法を定め、その方法に従ってランダムに抽出す る。その結果は不確実であるが、その不確実性を定量化するために統計手法を用いることができ るのだ。その不確実性は母集団の標本を扱っていることから生じている。大統領の政策を是認し ているアメリヵの有権者の真の比率といった、調査対象となっている宇宙の真の値は定数である。 それらはまさに未知のものである。われわれが統t[手法を用いることができる事象空間は、あら ゆる抽出可能なランダム標本からなる集合である"さらに、これは有限集合であり、その確率分 布は計算可能である。確率の実生活での意味は、標本調?の場合にはうまく規定できるのだ。
統計手法が天文学、社会学、疫学、法学、天気予報の観察研究に用いられる場合には、その意 味をうまく規定できない。これらの分野で起きる論争は、数学モデルが違えば違った結論になる という事実が基になっていることが多い。確率が計算できるように事象空間を特定できなければ、 あるモデルが妥当でないのは他のモデルが妥当でないのと同じなのだ"
多くの訴訟事例で見てきたように、同じデータを扱ってきたニ人の統計専門家が、そのデータ 分析で;致しないこともある"政府や支持団体による社会的意思決定を支援するために観察研究 に統計手法がますます用いられるにつれて、確率を求めるためにはあいま.いさを許してはならな いというこの基本的欠陥は、これらの手法の有用性に疑問を投げかけることだろう。
人々は本当に確率を理解しているのか
確率の実生活上の意味の問題に対する一つの解決法は、「個人確率」という概念だった。アメ リカのL - _?一■サヴェッジとイタリアのフルーノ ■デ■フイネッテイは、この考え方の一番の提 案者であった。この立場を最もよく表したのが、一九五四年のサヴヱッジの著書『統計学の基礎 (27ie^onsdats-?2s o/03fa.s-?ics )』である。この考え方では、確率は広く支持された概念である。 人々は確率を用いて自然に自分の人生を管理している。冒険に乗り出す前に、人々は直観的に想 像される結果の確率を決めるのだ。たとえば、もし危険に陥る確率がとても高ければ、そのよう な行動をとるのは避けるだろう。サヴHッジとデ.フイネッテイにとって' 確率は共通概念であった。それはコルモゴロフの数学的確率と結びつける必要はない。われわれがしなければならな いことといえば、tr尾一貫した個人確率の一般的な法則をつくることである。こうすることで、 出来亊の確率を判断する際に人々が矛盾することがないと仮定しさえすればよいのだ。サヴェッ ジはその仮定に甚づく内的0TJ尾):貫性の法則を求めたのである。
サヴhッジHデ.フィネッティのァプローチによれば、個人確率は個々の人に特有なものであ る。同じデータに基づいて、ある人が降水確率を九五%と決め、別な人がそれを七ニ%と決める ことは当然あり得ることなのだ。サヴェッジとデ■フイネツテイは、同じデータの系列が与えら れたときにそれぞれ首尾一貫した個人確率を持つ二人によって推定される確率が最終的には同じ 値に収束することを、ベイズ理論を用いて示すことに成功した。これは満足のいく結論であった。 人々は異なっているが分別はある、と言っているように思われる。十分なデータが与えられれば' たとえ最初は異見だったとしても、分別のある人々は最終的には同意に至るだろう。
ジョン-メイナード-ケインズは|九ニ一年に出版した著書『確率論U Tveasselpror ability}』のなかで、個人確率を何かほかのものとして考えていた。ケインズにとって確率は' 文化的教育を受けたすべての人々が、ある所与の状況に適用する不確実性の尺度だった。確率は 一つの文化の帰結であり、個人の内的な第六感などではなかった。
もしわれわれが七一:%の確率と六八%の確率のあいだで決めようとしているのであれば、この ァプローチは支持しがたい。一般的な文化では、そのような正確さの程度でもって合意に至るこ とはまずあり得ない-、ケインズは意思決定の際に、ある出来事の起こる確率を嚴密な数値で知る必要がほとんどないことを指摘した。たいていは出来事の起こりやすさの順番がつけられれば十 分だというのだ。
ケインズによれば、明日は雹より雨が降りそうだとか、雹よりも二倍程度雨が降りそうだとい ったことを知ることから意思決定が行われている。ケインズは確率の順序づけができることを指 摘した。あらゆることをほかのことすベてと比較する必要はないということだ。ニユーヨーク■ ヤンキーズがペナントレースに優勝するかどうかということと明日雨が降るかどうかということ のあいだの確率的な関係は無視していい。
このようにして、確率の意味についての問題に対するニつの解は、不確実性を定量化してほし いという一般の人々の願いに依存している。ケインズは自著の『確率論』のなかで、個人確率の 部分的な順序づけについて' きちんとした数学的構造を樹立した。彼はこの研究をコルゴモロフ が数理統計学の葱礎を築く前に行った。だが、自らの定式化とコルモゴロフの研究を結びつけよ うとはしなかった。ケインズは一九二一年に、自分の確率の定義は確率数学で表?された数理的 な数え方の公式とは異なっていると主張した。ケインズの確率は使い勝手がよかったので、それ を使う人々はなおもサヴェッジの一貫性基準に合わせなくてはならなかった。
このことは統計モデルを用いた意思決定の基礎となる確率の考え方に貢献することになった。 それは、確率が事象空間に基づいているという考え方ではなく、関係している人々の個人的な感 覚のなかから生じたものとしての確率という考え方である。そして、エルサレムにあるへフライ 大学の心理学者、ダニエル-力ーネマン(Daniel Kahneman)とエイモス■トヴァスキー(Amos Tversky)は、個人確率についての心理学的研究にとりかかった。
一九七〇年代から八?年代にかけて、力ーネマンとトヴァスキーは個人が確率を解釈する方法 を解明した。ニ人の研究は、F.スロヴィック(P.S10V1C)と共同編集した本『不確実性のもと
での決定 経鱗則と 0 り{Judgment Under Uncertainty: Heuristics and Biases} }一にまとめ
られている"二人は、大学生、大学教員、一般市民に対し、一連の確率的なシナリオを提案した のである。
彼らは、サヴェッジの一貫性基準に合致するような人は一人もいないことに加えて、大多数の 人々は異なる値の確率が意味するところについて、一貫した見方を保ちつづけることすらできな いことを発見したのである。彼らがわかつたことはせいぜい、人々は五?対五?という意味や 「ほとんど確実」という意味について、一貫した感覚を持ちつづけられるということにすぎなか った。力ーネマンとトヴァスキーの研究によれば、九0%の降水確率と七五%の降水確率を区別 しようとしている気象予報士は実際には両者の違いを説明することができないし、その予報を聞 いたどんな人でもその違いの意味に対して一貫した見方を持っていない、と結論づけるべきなの である。
一九七四年、トヴァスキーはこれらの結果を王立統計学会の大会で報告した。報告後の討論で、 スタンフォード大学のパトリック-スッペス(patricksuppes)がコルモゴロフの公理に合致し たうえに、ヵーネマンとトヴァスキーが発見したことにも沿った簡単な確率モデルを提案した。 このモデルを用いた人々は、その個人確率に一貫性があったのである。スッペスのモデルでは、
次の五つの確率しかない。
きつと正しい
どちらかといえば正しい
正しいか間違つているかは同じ程度
どちらかといえば間違つている
きつと間違つている
数学理論としてはこの考え方は興味を惹かれるものではない。このモデル力らおよそ半ダー スの定理しか導かれないし、その証明はほぼ自明である"もし、力?ネマンとトヴァスキーが正 しいなら、使い道のある個人確率のかたちであつても、数学のすばらしい抽象世界にはまつたく 使えないし、きわめて制限されたかたちの統計モデルしか生み出せない。もしスッペスのモデル が実際のところ個人確率に合致する唯一のものであるなら、広く一般に使われている統計解析の 手法の多くは使いものにならないことになる。なぜなら、それらは人間が認識可能な水準以下の 区別ができるにすぎないからである。
確率は本当に必要か
統計革命の背後にある基本的な考え方は、科学にとっての実物は数値の分布であり、その分布 は母数によって説明される、というものである。確率論にそのような概念を組み入れることや確 率分#を扱うことは数学的に便利である。数値の分布を確率の数学理論からの要素として考える ことで、これらの母数の推定量についての最適化基準を決めることや、分布を記述するためにデ 1夕を用いるときに生じる数学的問題を扱うことが可能になる。確率には分布の概念がつきもの であるように思われているので、人々が確率を理解するように、また確率の数学的な考え方を実 生活と結びつけようとすることに、そして科学実験や科学観察の結果を解釈するために条件つき 分布という手法を用いることに、かなりの労力が費やされてきた。
分布という考え方は、確率論のほかにも存在する。実際、「広義分布(improperdistlibution)」 (確率分布に必要な要件をすべて満たしていないので広義の意味での分布だが)は量子力学やべ ィズ手法の一部ですでに用いられている。待ち行列理論の発展は、列に到着する平均時間が列の 平均サービス時間に等しいという状況において、新しく列に並んだ人の待ち時間を表す変則分布 へと結局のところつながった。これは、確率理論の数学を実生活の状況に適用するというケース が、われわれを確率分布の外へ導くことになった例である。
ニー世紀には何が起きるのか
コルモゴロフの最後の洞察は、記号の有限列の性質によって確率を説明することだった。そこ では、情報理論は確率計算の結果として生まれたものではなく、確率それ自身の祖先であった。 おそらく誰かがコルモゴロフが置き去りにした知識の灯を拾い上げることになるだろうし、まさ にデジタル■コンピユータの性質が哲学的基礎をつくるような新しい分布理論を発展させること になるだろう。
科学が確立してくる現場で、まもなく新たなR * A ■フイッシャーが過去に誰も考えなかった ような洞察や考え方を引っさげて突如として登場するかどうかなど、誰にもわからない。たぶん、 中国の内陸部のどこかで、新たなルシアン-ル-カムが無学の農業を営む家族に生まれているこ とだろう。または、北アフリカで、中等教育で学校教育をやめてしまった新たなジョージ.ボッ クスが職丁_として研究をしているかもしれない。おそらく新たなガートルード.コックスが宣教 師になるという希望を諦め、科学パズルや数学に惹きつけられていることだろう。もしくは新た なゥイリアム.S.ゴセットがビール釀造時の問題の解法法を見つけようとしているかもしれな い。新たなネイマンやピットマンがインドの辺鄙な地方の人学のどこかで教鞭をとり、深い思索 にふけっているかもしれない。どこから次の偉大な発見が生まれるかなど、誰にもわからないの だ。
ニー世紀に入り、科学における統計革命は太勝利を得た。科学のあまり知られていない数分野 を除いて、決定論主義に打ち勝ったのである。だが、あまりにも広く使われるよぅになったこと で、その背後にある仮定は西洋世界の暗黙の一般文化のI部になってしまっている。それは隠れ た欠点のある勝利である。?来、隅に隠れたどこかで、別の科学革命が統計革命を崩壊させよぅ と固唾:を呑んで待っている。そしてその革命をつくるに違いない人々は、すでにわれわれのなか にいるのだ。
【第2章}
正規分布は、かつて最初に定式化したと信じられていた人物に敬意を表して、ときにはガウス分布と呼ばれる。と はいえ、分布の式を最初に著したのは力ール-フリ~ドリッヒ,ガウス0自1芝^-&.0'1:1(^£!3)ではなく"ガウス以前の数 学者アブラハム.ド‘モアヴル(Abl-aham de 0〇1与6)であつた。この前にダニエル.べルヌィ6§≪-11301:15&1〇がその 式を偶然見つけたと信じるに足る理由もある"これらはすべて、現代の科学史家ステファン■スティグラー(Stephen 泣&?)が名称由来の法則?'寄01-6?0|7}と呼んだもののーつの例である。この法則は'数学において発見者にちなん だ名前のものは、いまだに一つもないといぅものである。
クロムウユルの独裁政権に続く王政復古のあとに結ばれた、ィギリスの市民革命時のニ党派間の休戦協定は、新た な支配者が生存しているクロムウHルの信奉者を誰一人として訴追できなかつたことを意味している。しかしながら、死者 についての休戦はなかつた。ょってクロムウェルの死体とチャールズ1世の処刑を命じたニ人の裁判官の死体は掘り起こさ れ、大逆罪で裁かれた。彼らは有罪とされ' 頭を切り落とされてウェストミンスター寺院の屋根にさらされた。三人の頭部 は何年もそこに放置されたままだつたが、気がつくと消えていた"クロムウェルのものと考えられている頭部はロンドンの ある「博物館」に展示されている"それはピアソンが調査した頭部である。ピアソンは実際にそれがオリバ?.クロムウェ ルの頭部であると結論づけている。
1第3章】
スティグラーの名称由来の法則に従えば、ポアソン分布はー八世紀からー九?紀にかけての数学者3.0.ポアソ ン(simeonDelpoissoIl)にちなんで名づけられたが、ベルヌィ家の一人によつてポアソン以前に言及されていたのであ る。
これはスティグラーの名称由来の法則の系と考えることのできる例である。ゴセットはこの比率を示すのに「Z」
という文.字を用いた。数年後に教科書の?者たちは正規分布に従う変数を「2」という文字で表す伝統をつくり上げ、そし て「ステユーデント」の比を表すのに「tjという文字を使い始めた。
(5) ケンブリッジのようなイギリスの大学では、各学生にチユーターと呼ばれる個別指導教宵がつき、適切な教科を通 じて学生を指導する慣習がある。
【第4章】
(-6) 名称由來の法則は数学に限らない。イギリスでは、ハロー校のような閉鎖的な私立の中等学校は「パブリックスク 1ル」と呼ばれている。
グレゴール,メンデルは(実際の名前をヨハンというが,ー八六〇年代に豆を用いた?伝の実験を記したー連の論 文を発表した中央ヨ?nッバの修道士である"彼の研究はあいまいだと指摘された。というのも植物学研究の一般的な様式 に則っていなかったからである。彼の研究はウィリアム-ベイトソン(wiiliamBateson)の指樽のもと、ケンブリッジ大学 の生物学者グループによって発見された。ちなみにべイトソンはケンブリッジ大学に遺伝学科を創設した人物である。力ー ル.ピアソンが楽しんでいるように思えた数多くの論争の::つは、生体組織の微細的な不連続変化を考察しているこれらの 遺伝学者の研究に対する軽蔑から成り立っていた。その論争で、ピアソンは進化の本当の本質が母数の連続的変化にあるこ とに大きな関心を抱いていた"フィッシャーの初期の論文の一つは、ビアソンの公式がベイトソンの微細的な不連続変化か ら導出されることを示していた。この論文を読んだピアソンのコメントは、これは明白なことであり、フィッシヤーはこの 論文をベイトソンに送りべイトソンに真理を示すべきだ、というものだった。最終的にフイッシヤーは' ベイトソンのあと にケンブリッジ大学遺伝学科長を継ぐことになった。
【第6章】
一九六六年にグンべルが死去すると、彼の論文はニユ!ヨークのレォ-ぺック研究所に寄贈された。彼の反ナチス 活動は T/letevs?/' Gsmf>£.ccs;f3cts-s,p£.i&.SJ Papers o/ariAs^.-Afaz?) 5c ぎ?ar .§■. ぎ,ar §aEa;at!lというタイトルの 下に構成された八卷のマイクロフイルムとして刊行されている。
【第7章】
一九五0年に、インドQ o. R -ラ才(C.K.Rao)とハワ1ド大学で教鞭をとっていたテイヴイッド.ブラックウ.エ ル&§5;&31汚片与&)は、フイッシャーの正則条件が満たされない場合でも最尤推定量から最も効率的な統計量を構築でき ることを示した。この二人はそれぞれ独,Uに研究していたが、同じ定理を導き出した。ラオ=ブラックウ4ルの定理は発見 者の栄誉を称えた、ステイグラ!の名称由来の法則の例外の一つである。
【第8章】
ステイグラーの名称由来の法則は、プロビット分析にも?てはまる。ブリスは明らかにこの分析手法を最初に提案 した人物だった。しかし、この手法はー:段階のくり返し計算と複雑な数表の補間が必要だった".ー九五1_;:年にアメリヵン. シアナミド社のフランク.ウイルnクソン(Frfmkwilcoxon)が、マークをつけた複数の線に定規をあてるだけでプロビッ トを計算.できる 一■組のグラフを作成した。これはJ.T ?リツチフイールド(IT.LiFThfleld)とウイルコクソンの論文とし て刊行された"このグラフにょる解法が正しい答えをもたらすことを証明するために、附章にブリスとフイッシャーが提案 した数式を再録している。ー九六0年代*のいつだったか'無名の薬学者がその論文を無名のプログラマ|に渡し、彼はそ の附章を使ってプ0ビット分析を(プリスのくり返し解法を使0て)走らせるコンピユータ-プログラムを書いた。そのコ ンピユ?タ‘プログラムの説明書には参考文献としてリッチフイールドWウイルコクソンの論文を載せていた。まもなくプ ロビフト分析の他のコンビユータ■プnグラムが他の会社や大学の薬学部に2場し始めたが、すべてはこのプログラムが元 になっていて、その説明#にはリッチフイ:ルド=ウイルnクソンの論文が参考文献として掲載されていた。ついには'こ れらのプログラムを使ったブロビット分析が薬学や毒物学の文献に登場し始め、プロビット分析の「元」はリッチフイfル ド=ウイルコクソンの論文であると引用されるょぅになった。したがって、祠学引用索^訪(35.6??0_?ぎ^§1}2皆.7:}に 掲載されている、過去に刊行された科学論文の大多数で^fflされた参考文献の:覽表では、リッチフイールド=ウイルnク ソンのこの論文が、歴史上、最も^用された文献の一つとなっている。これはリッチフイールド=ウイルnクソンが何か偉 大なことをしたといぅ理由からではなく、ブリスのプロビット分析がとても有用であることを証明したといぅ理由からであ る。
【第10章1
f11)ここで用いたカ才スm論の記述は、Brian rJavie-'B&pl.cring Chaos; Theory and Bspnriment (Reading.'MA: Perseus Book--i999)にR つている。
【第:=章】
この章を通じて、私は本質的かつ数学的なアイデアはネイマンにあると考える。これは、ネイマンがその磨き上げ られた最終版の公式とその背後にある数学的展開を成しえたからである。しかしながら、ピアソンがネイマンに会う六力月 前から始まった、エゴン.ピアソンとウイリアム.シIリー?ゴセット(williamsealyGOSSa)との書簡からは、ピアソン がすでに対立仮説や異なるタイプのHラーを考えており' またゴセットがそのアイデアを最初に提案したことがうかがえる。 そういった事実にもかかわらず、ピアソンは' 彼{□身が持っていた「形のまだないアイデア」にネイマンが数学的な基礎づ けを行ったと認めたのである。
ケインズの名がついたものがある。たいていの人は、彼が経済学者で経済学におけるケインズ学派の創始者であり' 通貨政策での政府の市場操作によって景気の動向に影Rをもたらすことができる方法を論じた人物であると考えているが、 ケインズは哲学で博士号を取得しており〔訳注:原著の誤り。ハロッドの『ケインズ伝」|によれば、ケインズは名誉博:[.:以 外の博士号を取得していない?、彼の博士論文はf確率論U Tv?ilsosproo-&a.ic)』として::九ニー年に出版され〔訳 注:『確率論」は博士論文ではなく、ケンプリッジ大学キングス*カレッジのフェロー資格論文として一九?八年および〇 九年に提出したものを改訂して本にしたもの}、数理統計学の使用を背景にした哲学的基礎づけの発展に大きな金字塔を打 ち立てたのである。あとの?で、ケインズを引用する機会があるだろうが、引用する場合には'経済学者としてではなく確 率論者としてケインズを5用するであろう。
【第12章】
疫学は、統計学と緊密に結びついた分野の:つである。人の健康のパターンを検証するために統計モデルがよく使 われるのだ。:番簡単なかたちでは、重要な統計量の表を作成するとき"その分布の母数に対する(≫単な推定量を使う=も っと複雑な場合には、疫学は感染症の勢いを検証‘予棚するために、統計学の高度な?論を利用している。
【第13章1
ステイダラ;の名称由来の法則では、ベイズの名前に闕するものがたくさんある。ベイズは条件つき確率の対称性 に気づいた最初の人物ではない。ベルヌイはそのことに気づいていたように思えるし、ド.モアヴルもそれに言及している。 しかし' ベイズだけが称贊を得たのである(もしくは、ベイズが出版を渋っていたことから考えて' ベイズが泥をかぶった とも言えるかもしれない)。
実際には、マデイソンだけがこのような主張をした。ハミルトンは、自分が*いた論文のリストを生前作成してい たが、彼の死後三年?ってから友だちによってリストが公開され、やっと名乗りを上げることになったのである。
116章】
この「ステユ'~テント」はウイリアム.S ■コセットのへンネ ^であつたことを思い出してほしい。コセット
は最初に小0本での統計的検定を開発した人物である。
(S) 実際、ステイグラーの名称由来の法則から判断すれば、ウイルコクソンがノンパラメトリックな手法を提案した最 初の人物ではなかった。一九一四年の力ール■ビアソンの研究は、こういったアイデアのいくつかを提案しているように思 える。しかしながら、この分野でウイルコクソンの研究が発表されるまでは、ノンパラメトリックなアブローチはそれほど 抜本的な変革をもたらすだろうとははっきりと理解されていなかつたのである。
【第U章】
アメリカでは、ー0年ごとの人ロ調査で、ある日の全人ロを数えることになつている。しかし、一九七0年以降の 人1-1調?では'そのー奔調?で多くの人を数え忘れたり、ニ重に数えたりしていることが明らかになつた。さらに、数えら れなかった人たちはたいてい、社会経済的に特殊なグループの人たちで、数えられた市民と「同類」と一概に仮定すること はできない。だからアメリカでさえ、ある決められたHにどれだけの人nがいるかを正確に知ることなどできない、と言え るだろう。
ー九六0年代末に、私はルイス‘ビーンが講演者であった会議に出席した。彼はギャラップとともに、政治立候補 者にアドバイスするために自分たちの調査を使い始めたころの話をした。ギャラップはギャラップ世論調?という記事配給会社を株式公開した。ビーンは非公開の調査を続けていたが、会社をつくったのはよいが、名前をギャラッピング.ビ:ン 世論調齊と呼ぶようにギャラップに警告した。
【第18章】
(21) これらの抽象的な性質を記しておこう。「T」はもちろん「真(Tme)」、rFJは「偽(False)」を意味する。明ら かに意味のない記号を使うことで、数学者はそのアイデアの違いを考えることができる。たとえば、1二つの真理#:?. ! 「T」、rFJ、「M (Maybe)」の意味??を提案したとしよう。これは数学にとって何か役に立つだろうか"純粋な抽象記号 を使うことが、記号論理学の梭雑さを魅カあるものにしており、このテーマは過去九0年ものあいだ数学的研究の活動領域 でありつづけている。
(U) 一九八〇年代に連邦裁判所で上級審まで争われたf'*hダ、-(Mal'der)対G . Q .サhル(G,D.searie)社誰訟によ れば' 原告?は彼女の病気がIUDの使用によるものであると中:張した。原告は論拠として' IUDを使った女性のうち骨 盤内炎症疾患患者が明らかに?加していることを示す疫学的証拠を提出した=被告側は、相対リスク(1;^£::1を使って炎症 にかかる確率をIUDを使わないで炎症にかかる確率で割ったもの)にRづく九五%信頼区間を計算した統計的解祈を提出 した。その信?区間は0.六から三‘〇であった。陪審3只は行き詰つてしまった。裁判肓は被告に有利な判決を次のように 言い渡した。「少なくとも股因の?那的な確率に基づいて原因の推定がなされたと保証されることが、特に重要である」。こ こでは'確率が個人確率として定義されることが暗黙の仮定となっている。裁判官の意兒は「原因」と「統計的相関関係」 とを区別しようと試みたけれども、このことが含む混乱、そして>.級審での判決でもまた起こる捉乱は、因果関係の概含に 含まれる基本的な不;致性を#調しているが、これはラッセルが五0年以>.も前に議論したことであった。
(23) 共著者は、国立がん研究所のウイリアム.へンツKル(WIllisnHaellszeo、アメリカがん協会のE -力ルター.ハ ^yKs.culternamlnond) ジョンズ.ホフキンス大学衛生公衆衛生スクtルのアフラハム,リリエンフイールド (Abraham LilienBes)'国立がん研究所のマイケル.シムキン(Michael shinlkilo'ス01ン=ケッタリング研究所のアー ネスト-ウインダー (Emstwynder)である。しかしながら、論文はコ!ンフイールドによつて計画され、まとめられた。 特にコーンフイールドはフイッシャーの識論を注意深く検証し' 論駁する章を書いた。
{24} フイッシヤー力ヒルとド^―ルの研究をことさらにこき;卜ろすことにしたという事%.にもかかわらず肉^はフイッ
シャーの手法を医学研究に拡?することにかけては卓越していた。ヒルはイギリス医学界に対して、フィッシャ:の実験計 画の原理に基づいた研究でなければ有益な情報は得られないことを、ほとんど独力で納得させた。それなのに、のちに才ッ クスフォード大学の医学部欽定講座担当教授になったリチャード‘ドールという名前のほうが' 現代医学研究の統計的モデ ルへの転向と同義となつている。
【第19章】
(25) へンリー.力ーヴァーU八九OI i九七七)は、尊敬すべき学術対象として数理統計の発展に尽くした孤独な開 拓者であった。一九二:年から四一年にかけて、彼はミシガン大学で 一0人の博士課程学生の論文アドバイザーで、すべて の学生に数理統計学に関するトピックを与えた。!九三0年1';数理疏計学論集誌をつくり、|九三八年には、その雑誌を支 援する学者組織、数浬統計学会の立ち上げを手伝った。この雑誌が高い評価を受けるようになった経?については第20章で 述べる。
【第20章】
C26) プリンストン高等研究所には、アルべルト.アインシュタイン(AlhcrtEE-stein)という名のもう;人の研究者が いた。彼は物理学者で、ムーアの:言うr道を掃除してきれいにする」よりももっと込み入った業績があったが、彼の研究は 「現実社会」への応用でかなり汚れていた。
今日、産業界のほとんどすベての品質管理部門は、生産高変動を追跡するためにシューハートのチャートを使って
いる」シューハ!トの名は、スティグラーの名称由来の法則の小さな例である。シュ,.-ハ^ ^ *チャートの実用的で数.学的
な形式化はゴセット(「ステューデント」)によって最初になされているように思われるし、ジョージ.ゥディニー-ユール (George Udny yule)の初期のテキストにも現れているかもしれない"しかし、ゥォルター*シューハ^?^はこの枝術をい かにして品質?理に適用するかを示し' それを効果的な方法論として普及させたのである。
一九八〇年代初め'銃計理論の急速な発展が原因で、数理統計学論集誌はニつの雑誌、統計学論集(/1|〇^0/ ccfaiisac.5)と確率論論集 04rmaso/ pr&oMaJ/)へと分裂した。
第二次大戦が終わるとすぐ、王立統計学会誌は^初三つの雑誌
いう名前のものに分割した。,Se3が結局、応用統計学upug-as^tK-sr.s.)という名前になった"王立統計学会は'
6VriesAでビジネスや政府に影Rを与える一般的問題を扱うようにしている"563は、どんな抽象性も含む数理統計学 を扱っている。応用統計学誌は論文が応用されるようにと?張ってはいるが、各号には「応用」とは名ばかりの論文もあり、 もう一つの美しいが抽象的な数学という宝石の開発を正^化するためだけにそこに出ている論文もある=
【第21章1
ハ?バーダッシャーズ.アスク.スク;ルは、古くからある同業組合のハーパーダッシャーズ組合(一四四八年に つくられた)によって設立された七つの学校のうちの一つである。ロバr .アスク^0ヴっ'^>?〇>)はハーパーダッシャ 1ズ?合の会長だった人で'::::ハ八九年に亡くなったが、ハーバーダッシャーズ組合Mのなかで貧しいニ?人の子供たちQ ために学校をつくるようにと財産を残した(この遣産は今日まで組合によって管理されている)。今ではニ:一0?人の男子 学生を擁する名高い学校となっている。ハーバーダッシャ1-ズ組合は、理事長を含め半数以上の理事会Mが組合員である理 事会を通じて、その繋がりが保たれている。
数学のテキストにはひねくれたタイトルのものがある。最も難しい本には普通、「……へのイントロダクション」と か「……の初等理論」などのタイトルがつけられる。フェラーの本は::::重の意味で難しいのである、一つは「イントロダク ション」であ.り、もう一つは「第一巻」であるからだ。
【第22章】
数学的記法は、文字の並び、ローマン体やギリシャ文字、ねじれた線やら上つきや下つきから成っているが、数学 者以外の人々(そして一部の数学者)を怖がらせている数学の一面でもある。しかしそれは、限られたスぺースのなかで、 複雑な概念を互いに関連づける本肖に便利な方法である。数学論文を読む際の「コッ」は、各記号がある意味を持っている ことを認識し、それが紹介されたときその意味を知り' そして、あなたはその意味を「理解している」と思い込み、その記 号が扱われる方法に注意を払うことだ。数学的エレガンスの本質は、読者がすぐにその関係を理解することができるような 非常に系統だった記号の表し方をすることにある。これは' イT;ジー,ネイマンの論文に見受けられるエレガンスさである。 私の博士論文はそのHレガンスさからほど遠いものだったのではないか' と恐れている。私は' できる限り数学的モデルのすべての場合が含まれるように、入念に記号を使ったが、下つき文字にさらに下つき文字をつけたり、上つき文字に下つき 文字をつけたり、ある場合には、下つきで変数の成分を表していたりした。テユーキーが私の定理をその日の午後初めて兒 たのだが、彼が頭のなかで定?:で使っていた褪雑に絡み合った記号を完璧なかたちとして再現できたことに、私は'ひっくり した。私の表記の混乱ぶりにもかかわらず、テrilキ1-は私に勤め:1を提供してくれた。しかし'私にはー-.人の;/-供ともう すぐ生まれてくる子供もいたので、もっと給料のいい職のほうを選んでしまった。
ベルは一九四?年代から五?年代にかけて、数学に関する評価の高い本を数冊書いた。彼の『数学の人々(Merio/ Mathematics)一はいまだに、一八世紀と一九世紀の偉大な数学老に対する古典的な伝記的な参考文献であ.る。また『数hu い0v'ul3oQy)』は、ここで引用した文章はこの本からなのだが、数占いを扱っており、この本を書くことを掃除婦か ら勧められたと彼は書いている。
この古典的な例はボウド030de)の法則である"それは、太陽系において、太?からの距離の対数と惑星の数との あいだには線形関係が存在するという経験的観測のことである=実際、海王星が発見されたのは、天文学者が他の惑£の近 似的な軌道を予測するために' ボウドの法則を使い、その軌道内に惑星を見つけたのである。木星や土星の宇宙探査機が惑 /Iの近くにある小さな衛羅を発見するまで木#-.のそれまで|?^|されていた衛^はポウドの法01]に従っているかのように見 えた。ボウドの法則は偶然の:致なのだろうか。もしくは、惑星と太陽との関係について深遠でまだ理解されていないこと をわれわれに敦えているのだろうか。
【第23章】
ある単語が統計解析に現れたとき、その単語の通常での意味と数学独011の意味とをはき違えることがよくある。私 が製薬業界で働き始めたころのことだ。解析の.,つに結果の伝統的な表を含んでいて' そこに、データにおける小さなラン ダム変動によって生じた不確実性に言及した:くだりがあった。これは、伝統的に使われる表では「誤差(error)」と呼ば れていた。上級管理職の.1人は、そんな報告書をアメリカ食品医薬品局(FDA)に送るのをいやがった。「どうやったら われわれのデータに間違い(〇ロ〇10がありましたと認めることができるのかね?」と尋ね、臨?データが正しいと確信す るべく払〇た多大な努カに言及した。私は'それがそういったことに対する伝統的な|:3い|01しであると指摘したが、彼は私 に、その表現を変えるように命令した。私はコネチヵット大学のスミス博士に連絡をとり'この件について相談した。スミス博-.[;.はその表現を「残 差(1^£§0」と1]正するようにアドバィスしてくれて'いくつかの論文でこれを残差(ョ5£:113ー氏1〇1!.)と表していること を教えてくれた。私はこのことを向じ業界で働いているほかの統計学者に教えると、彼らもそれを使い始めた。やがて、こ の表現はたいていの医学文献で標準的な専門用語となつた。少なくともアメリヵでは' そこに間違い(er31.)があると認 めるような人はいないように思われる。
モンテヵルロ研究においては'個々の測定値は現実に起こりうる事象を真似て乱数を使つて生成される。これが数 千回以上くり返され、得られた結果は統計解析で処理され、擬似的な状況における特定の統計解析の効果が決定されるので ある。この研究の名はモナコにある有名なヵジノにちなんで名づけられた。
【第24章1
ホーソン.T場は「ホ11ソン効果」として≪|.られる現象に〇1らの名前を与えている。ホーソン:1'場では、;九三0年 代に二種類の管理方法の差異を測定する試みが行われていた。どちらの方法においても' 労働者が努力水準を大幅に高めた ため、この試みは失敗した。これは労働者が入念に観察されていることを知つていたために生じたのだつた。それ以降、ホ 1ソン効果という用語は、単に実験が行われていることから生じる状況の改善を指すために用いられている。新しい治療法 と従来の治療法を比較する大規模な臨床試験では、しばしば、従来の治療法が過去の経験に基づいて予測される以上に患者 の健康状態の改善を一:小すという事実があるが、これが典型例である。この現象は従来の治療法と新しい治療法の効果の差を 検出するのをいつそ、っ困難にしている。
【第27章】
一九六三年にィエ?ル大学のフランシス‘アンス.nム(Francis Ailscombe)は、医療上Q 一 Tズにいつそう沿-*っよ うな' まつたく異なるアブローチを提案した。ネィマン=ビアソンの定式化は' 分析者が間違いを犯す回数の割合を変える ことはない。アンスコムは、統計解析者が長期的に誤りを犯す確率が、なぜ治療が効果的かどうかを判断する材料にならな いのかを疑問に思つた。代わつて、アンスコムは治療を受ける患者数は限りがあることを示した。患者のうちの何人かが、 臨床試験である治療を受ける=残りは臨床試験で「最善」と判断された治療を受ける。もし臨床試験で扱う患者数が少なすぎると、.どの治療が最善かという判断は誤差の範囲内となるかもしれず、もしそうならば、残りの患者全員が間違った治療 を受けることになる。反対に臨床試験で扱う患者が多すぎると、別の治療(「M善」の治療ではない)を受けたすべての治 験患者が、間違った治療を受けつづけることになる"アンスコムは、分析基準はより劣った治療を受ける患者(臨床試験で 扱われる患者とその後に治療を受ける患者の両方)の総数を最小限にするべきだと提案した。
1第28章】
イタリアのファシズムはその初期において、家族主義を強く支持していた。これにより、既婚男性のみが政府内の 職に就くことが許された"大学教員の職についても同様だった。一九三九年に頭脳明晰なブルーノ,デ-フィネッティはト リエステ大学の数学の正教授職を全国規模競争のなかから滕ち取ったが、肖時まだ独身であったため、その任に着くことが できなかった。
一八世紀のあいだに、ユークリッドの『原論(Mel'sts)iにある数学体系は幾何学のテキストに移され、論理的 演繹のバターンが体系化された。この体系のなかで、「定理」という言葉は扱っている問題に特有の結論を表すために用い られていた"いくつかの定理を証明する際に、最終的な定理の証明に使う中間結果(定理)を証明しなければならない場合 がある。だが、それは他の定理の証明に役立つこともある。そのような結果は「補題」と呼ばれた。
私は自らの博士論文で、少なくとも統計学者のあいだでは「複合ポアソン分布(ccmpound-poisssl distributions)」 という名で知られている分布のクラスを使った。論文を書くにあたつては文献を調べなくてはならず、そこで私は経済学や オペレーション'ス,リサーチ、電子工学社会学の文献でも同じ分布を見つけた。これは分野によって一たどたどしいポア ソン(stutteringPoisson)」とか「ポアソン二項(分布)(poissolvbinomiai)」と呼ばれていた。ある文献では「五番街のバ ス分布(psh>vemle bus&stl.ibution)」だった。
?数学のトレーニングを受けていない読者にわかりやすい著書や論文
cdOMN, JAMMSW; alazahn, Douglas A.1994 Tsr.e /flwncmco7se o/^ass^.c&cvmsusrinCQ.dcel- mont-CA: u.t(tltimet-,earmncfaF*ubkcatlons.
ボーエンとザーンは、大学(ボーエン)と産業界(ザーン)における科学者への統計コンサル タントとしての経験を合わせて総括している。この本は統計学を専門とする人の入門書となっ ているが、主として共同研究を行ぅ科学者の心理的関係について書かれている。洞察や例を使 って' 読者にコンサルティングを行ぅ統計学者の仕事がいったい何であるか、かなり現実的な 雰囲気を伝えている。
roox, GEORGE E. P.1976‘ Science 目d statistics, Josr5ao/芽ebm6rs-a?7.co&us-&ca^ssos.a- ??.§ 71:791.
これはジョージ.ボックスによるスピーチである。このなかで彼は、実験や科学的推論につい ての自身の哲学を明らかにしている。数学のトレーニングを受けていない読者にも理解しやす
ジョアン.フィッシャー‘ボックスはR*A -フィッシャーの娘である"この父親の伝記で、 彼女は多くの父親の研究の性質および重要性を説明する優れた仕事をしている。さらに、個人 的な思い出を含む、人としての父親の考え方を著している。彼女は(家族を見捨てたときのよ ぅな)感心できない父親の振る舞いをごまかさず、彼の動機や考え方について理解を示してい る。
DHM§G, W.WDW ARDS,1982. Out 6Visis. Cambridge, MA: Massachusetts Institute of T'echnoloOQy; cro11trDr for>dvarlced Mncfcllseermcrastudy,
これはアメリヵ企業の経営に影響を与えることを同的にデミングによって注意深く害かれた本 である。数学的な記法を使わずに、分散の源泉やその操作的定義といった重要な考え方を説明 している。また、さまざまな産業での状況を例として取り上げている。とりわけ本書はこの非 凡な人物の延長線上にあり、まさに彼が話しているかのよぅに書かれている。彼は産業界と政 府の両方について、経営上の批判やアメリヵの経営慣行の馬鹿らしいと思われる部分の多くに ついての批判を抑えることなく繰り広げている。
KFfoON,tcR.ADLEy.1984. The art ofieaming from experience.cocs-nce 225:1 56.
この短い論文は、ブートストラップの発明者によって書かれた「ブートストラップ」法の開発 および他のコンピユータ集約的なリサンプリング手法について解説したものである"
K- >■ swR' P3a wo^&- 【R ■ A ■フィッシャー『統計的方法と科学的推論』渋谷政昭■竹内啓訳、岩波書店、一九六 M年J
後半の章でいくつかの数学的な導出を行っているが、この本は科学的推論によって何がー1ロえる かを注意深い害きー^葉で説明しようとしたフィッシャーの試みである。これはィエシー:不ィ マンの研究に対するフィッシャーの答えになっている"この本の題材の多くは、以前に論文と して発表されたものだが、現代数理統計学の基礎を築いた天才による、それ全体が意味するこ とについての見方の要約になっている。
HOOKE, K 1983^t/ie Liar.s From^e^as-? c&ss.zewYprk:Marcelcekker.
一般雑誌における統計手法の誤用に悩まされつづけてきた統計学者は、統計学者以外の人々に 対して、よい統計的実践を行うための概念や手順を折に触れて説明しようとしてきた。残念な ことに、私が見てきた限り、これらの本は甚本的に統計学者にしか読まれず、本来、対象とし た人々からは無視されてきた。この本はこうしたもののな力で最も優れたものの一冊である。 TC〇TZ, SAMUHL.1965. Statistical termB'ology-wussiarl vs, "Englisli in the light of th.e development 0f statistics in the IIS. S.R.Amerlcar?;^a^.s?.p.a'sl?92 2.
コッツはロシア学派の研究を考察した英語を話す統計学者の第一世代の一人である"彼はその 研究の一流の翻訳家になるためにロシア語を学んだ。この論文では、ロシア人研究者がたどった続計手法の悲運についても詳述している。
MA^ikA^CYR. 19S7. The Keys to Excellence-The Story of the Derning Philosophy. Los Angel
les,CA: Preswick Books.〔ナンシー-マン『デミングの品質管理哲学 QCの原点から新た
な展開へ』石川馨監訳、中村定訳、ダイヤモンド社、一九八七年〕
ナンシー.マンは西海^tの複数の製造会社で数理サービス部門の長となったあと、カリフォル ニア大学ロサンゼルス校の教授陣に加わり、今は小さなコンサルティング会社を率いている。 数理統計学に対する彼女の貢献には、製品の寿命試験に用いられる複雑なクラスの分布の母数 推定における極めて巧妙な方法を提案したことなどがある。彼女はW ■エドヮード*デミング と多くのかかわりがあり、彼のよい友人の一人でもあった。本書は数学者でない人々のために デミングの研究や方法を解説したものである。
PHAESON, KARrl 911.TTw? GrarKr^arro/coctes.ce‘ Meridian Library, K!Y-serldlan Library Mditlon (一957).〔力ール.ピアソン『科学の文法』(増訂第2版)安籐次郎訳、出版社不明、一九八ニ 年\ビアスン『科學概論』平林初之?訳、春秋社、一九三三年もありj
新たな科学的発見によって取って代わられてしまったため、ビアソンの用いた例のいくつかは 今H時代遅れになっているものの' 本書の洞察やよく書かれた哲学の断片は、ほぼ一世紀を経 た今でも楽しく読むことができる。それは読者に著述や考え方のピアソンならではの優れた例 を与えてくれる。
KAPP K.1989U?聲斧 s asa^: psas-'sos-ance So 夸0?.Fairland, MD: 1ntemational Go-
Operative Publishing House,
〔c , R ?ラオ『統計学とは何か偶然を生かす』藤越康祝-柳井晴夫.田栗正章訳、丸善、 一九九三S
C.ラドハクリシュナこフオは統計専門家の中で尊敬を集めた人のー人であるロ?身地で彼は ネール記念教授に任命され、インドの複数の大学から名誉博士号を与えられた。アメリヵ統計 学会のウイルクス-メダルを受章し、四つの主要統計学会のフヱローに任命された。彼の公刊 された研究には、多次元におけるかなり複雑な導出が含まれているが、本書は彼がインドで行 った人気の高かった一連の講義をまとめたものである。そこでは彼が慎重に考え抜いた、統計 モデルの背後にある価値、目的、および哲学観といった概念を表している。
TANUR, JUDITH 声、d」972."as--s:^GSAde°"e f/n/mosn. San Francisco: HoldenlDayJ Inc■〔ジュディス,M ?タヌール編『統計学講和??未知なる事柄への道標』安藤洋美監訳' 現代数学社、一九八四年〕
過去ニ〇年にわたって、アメリヵ統計学会では高校生や大学の学部学生向けの^及プログラム が行われている。学会の委員会では教材を用意してきたし、学会はビデオ教材の作成に資金提 供して、そのぅちのいくつかは公共テレビ局でも放送された。本書はヶース?スタデイ(事例 研究)の集合体になっており、そこで統計手法は重要な社会問題や医療問題に応用されている。 ケース■スタデイはそれに関与した統計学者によって書かれているにもかかわらず、まったく、 あるいはほとんど数学的知識のない高校生が読んでもわかるよぅに*かれている。この本は各々の長さが一〇ぺージほどの四五のエッセィからなる。その著者には、私が本書で取り上げ た人々の何人かも含まれている"そして、次のような質問に取り組んでいる。人々は死を先延 ばしにできるだろうか。警官を増やすと犯罪発生率が減少するだろうか。そのほかには、勢力 が伯仲している選挙の議論、論文集FederalistPapersの分柝の簡単な記述、新たな食品の評 価方法、消費者物価指数、将来の人口成長の予測、種まき実験、対空砲火の照準といった問題 などである。
これはテユーキーがフリンストン大学で^計学を学ぶ初年次の学生のために書いたテキストで ある。これは事前の知識がまつたくないこと! '高校の代数の知識さえないこと??を前提と している"テキストはひとかたまりのデータに直面した人の視点から、統計的推論を取り扱つ ている。