▼▼▼▼▼▼▼▼ ▼▼▼▼▼▼▼▼
お問合せはこちら セミナー詳細こちら
医療統計学:用語集ら行
ライカ一卜尺度
意識の調査で,一連の質問の各々の園答の選択肢に順序があり,それぞ れのM答に基づいて元のスコアが決まる場合によく使われる尺度.たと えば,被験者はあることに対する考え方について一連の選択肢の中から 同意の程度を選ぶよう指示される.それぞれの選択肢には番号,たとえ ば,1:強く同意する,2 :同意する,3 :どちらともいえない,4 :否 定する,5 :強く否定する,を付与しておく.複数の質問に対するこれ らの番号の和が合成スコアとして用いられよく使われるライ カート尺度には,新生児の状態を評価するためのアブガールスコアがあ る.これは,以下の5頌目の各々に割り当てられた点数(0,1または2) の和である.
ラザニアの法則
いったん臨床試験が開始されると,適切な患者数は,試験が始まる前 に見積もられた数の10分の1にだんだんと減ってしまうことを述べた もの.
ラチェットスキヤン統計量Ratchet scan statistics
年間を通しての定常的な発生に加えて,ある特定の期間に病気のT発病 率の急な増加があったかどうかを調べるために使われる統計量.たとえ ば,この統計量は夏の間にAIDSの発生の増加があったかどうかを調べ るために使える.
_ラッシュモデル Rasch model
1組の対象者集?に実施した認知テストの結果を解析する;数学モデルの 一つで,心理学でよく使われる.観測不能な潜在的な特性があると仮定 し,個人の能力を表す母数とテストの各項Hの難易度を表す母数の推定 を行う.
^ American Journal of Epidemiology,1995, 142,1047_58.
鑾ラテン方格latin square
実験計画法の-つで,奥験の誤差から2つの外的要因(たとえば,患者 と診断カテゴリ一)による変動を取り除いて,処理効果の検m力を上げ ることをEi的とする.四角形(方格)の行と列は,2種類の外的要因の それぞれの水準を表す.また処理はアルファベットで表し,どの文字も ある行またはある列に1回しか現れないように並べられる.以下は, 4 x 4のラテン方格の例である.
ABCD
BCDA
CDAB
DABC
このような実:!矣計画から得られるデータの海早^に際しては,変動の3つ の要因の間にはt交互作用がないと仮定する.
? Cochran, W-G. and Cox, G.M.,1957, Experimental Designs, 2nd edn? J* Wiley & Sons, New York.
HラべプロットLAbb6plot
評価指標が2値変数であるf臨床試験のf メタ解析でしばしば使われるプ ロット.各治療群の事象リスク(事象数をグループ内の患者数で割った もの)を,とりあげた各研究の対照群の事象リスクに対してプロットす る.もしもこれらの研究が比較的同質であれば,点は1本の直線の近傍 に雲のように密集するであろう.その場合,直線の勾配は,プールされ た治療効果に対応すると考えられる.大きな逸脱やばらつきがあれば, とりあげた臨床試験のエフェクトサイズの問に異質性があることを示 す.図75に一例を示した.
^ Annals of Internal Medicine, 1987, 107, 224-33,
o ^ o o 0 o
00/3 6 4 2
?遊 ST3 次 〇S S-H2)? 5froE 0LOZ:へ-^n Hha
02040SO80100 (%)
プラセボ投与による50%以上の除痛
図75ラべプロットの例.凶中の円の人きさは各試験におけ るサンプルサイズを:衣す.
關ランインmn-in =事前観察期間 ■乱塊法 randomized block design (RBD)
それぞれのtブロックの中で,処理が実験単位にランダムな順番で割り 付けられる実験計両.
画卵性判定 zygosity dete「mination
双生児が一卵性かニ卵性かの決定.質問票方式により高い信頼度(95% 以上)で決定できるが,それだけでなく遺伝子が100%同じか50%だけ 同じか調べるために,遺伝子マーカを一定数-型別することにより希望す る任意の精度で推定を行うことが可能である.t双生児解析で重要. k Sham, P*f 1998, Statistics in Human Genetics, Arnold, Ix>ndon.
靈ランタムウ才一クrandom walk
ある特定の確率に従って点から別の点へ離散的に動く粒子の運動.具体 的な例として,粒子の位置が人の集団の人数を表すとしよう.左側への 1?は,1人の死を表し,右側への1歩は,1人の誕生を表すことにな る.この過程は粒-了?がいったん原点に戻れば終了する.それゆえ,原点
は吸収壁(absorbing barrier)と呼ばれる.?マルコフ連鎖
Chatfield, C.,1996, The Analysis of Time Series, 5th edn, Chapman and Hall/CRC, Boca Raton, fL,
_ ランダム回答法 randomized response technique
微妙な問題に対する情報を集める方法で,?答者がどの質問に答えるか について偶然の要素を取り入れたもの.中絶に関する調査では,たとえ ば,女性は次の両方の質問を与えられる:「中絶をしたことがあります か」と「中絶をしたことはまったくありませんか?そして(サイコロ のような)回答者が操作できるランダム化の器具が出す結果に基づいて, どちらの質問に答えるか指示される.返答はまわりにはわからない,と いうのは回答者がどちらの質問に答えたかを,[〇]答者以外誰も知ること ができないからである.しかし,得られたデータはたとえば,もし「中 絶をしたことがありますか」という質問が選択される確率がわかってい てそれが0.5でなければ,中絶をしたことのある女性の割合のような量 を推定するのに使うことができる,
Daniel, W*W.T 1993, Collecting Sensitive Data by Randomized Response ^ An Annotated 5沾/印ぎツ,2nd ean,research monograph no. 107, Georgia State University, Busi- ness Press, Atlanta,bAi
?ランタム化検定randomhzati〇n tests
特定のf標本分布に頼らずに,データから直接に統計的有意差を求める 方法.たとえば,2群の比較調査では,データを2つの治療群に分ける (並べ替える)やり方をすべて列挙し,分割した(並べ替えた)それぞ れの部分に対して,分割した(並び替えた)データを元に1検定統計量 (たとえば,1スチューデントの検定や検定)を計算する.そして, それを元に検定統計量が,実際に観測された場合より極端な値になる割 合を算出する.もし,その割合が選択されたある有意水準aより小さ ければ,結果は水準aで有意となる.
Edgington, E.S.,1995, Randomization Tests, 3rd edn} Marcel Dekker, New York.
_ランダム化同意割り付け「andomhzed consent design
もともとは,臨床医が患者を1ランダム化臨床試験に組み込む際に感じ る倫理的な問題を克服するために取り入れられた実験計画.患者の適格 性を確認したあと,患者を2つの治療,AまたはB,のどちらかにラン ダムに割り付ける.治療Aに割り付けられた患者へ,同意するか打診 する.患者は,彼らの病気に対して治療Aを受けたいか尋ねられる. 治療に伴う潜在的な危険,利点,治療の選択肢のすべてが話し合われる. もし患者が同意すれば治療Aが行われる.そうでない場合は,患者は 治療Bまたは他の別の治療を受ける.ランダムにBに割り当てられた 患者も,同様に治療Bについて聞かれ,同意が得られなければ別の治 療へ移される,?ジーレンの単純同意割り付け ^ New England Journal of Medicine,1970, 300,1242-5.
_ランタム化臨床試験「andomhzed clinical trial (RCT)
t臨床試験で,ランダムな割り付けによって治療群を生成するもの.
_ランダム係数モデル random coefficients models
f縦断データに対する4昆舒効果モデルの一つのタイプで,患者ごとにラ ンダムな切片と場合によってはランダムな傾きをモデルに組み込むこと により,繰り返し測定データに対して患者ごとに異なる反応を組み込む ことができる.吟多水準モデル
^ Brown, H. and Prescott, R.,1999, Applied Mixed Models in Medicine, J. Wiley & Sons, Chichester.
關ランダム誤差random error
計測値の系統的な部分と,測定している量の真の値との盖.
_ランダムダイアル法random digit dialing
電話番号の数値を無作為に選択することにより,標本とする世帯を抽出 する方法.最初は世帯調査の標本抽出法として開発されたが,今でも疫 学の研究でf症例-対照研究において対照を選ぶのに広く使われている.
^ American Journal of Epidemiology, 1984, 120, 825-33.
■ランタムなrandom
偶然に支配された.他の要因によって決まることがまったくない-非決 定論的な.
圈ランタムな欠測missing at random (MAR)≫?欠測値
圓ランダムな事象 random events
決定論的な規則性をもたないが(例:放射性物質からの粒子の放出), -定の統計的な規則性はもつ事象(たとえば,放射性物質からの粒子の 放出は,1ポアソン分布に従う).
■フンタム標本random s6mpie =無作為標本 _ランタム変数random variable =確率変数 _ランタム変動random variation
特走可能な原因によって説明できないデータの変動.
■ランダム割り付けrandom dbcafion
特にT臨床試験において,治療群と対照群を構成する方法の一つ.被験 者は偶然の事象,たとえばコインを投げる,の結果に某づいて活性物質 による治療またはプラセボを受ける.この方法は,個々の患者にバイア スのない公平な治療の割り付け方法を提供し,有意差検定ならびに他の ほとんどの統計的方法に対して,しっかりとした足がかりを保証する. さらに,この方法は共変量の影響を,測定したものもそうでないものも 統計学的に許容できる方法で分散させる.?ブロックランダム化法, 最小化法,不等確率法
^ Everitt, B.S. and Pickles, A, 2000T Statistical Aspects of the Design and Analysis of Clinical Trials, Imperial College Press, London*
匪:;’c響フィッシャーの科学的調査に対する多くの業績の一つ.
_ランドマーク解析landmark, analysis
f生存時間データにときたま適用される解析方法の一つ.この解析では あるランドマーク時点(たとえば無作為化後6ヶ月目など)まで生存し, その時点で健康状態およびその他の共変量の履歴が共通である対象につ いて,ある処理がその後の生存時間を予測できるかどうかを評価するた めに検定が使われる. k Statistics in Medicine,1996,15T 2797 ■ 812.
羅患 morbidity
人間集団の発病について記述するのに,疫学で使われる用語,保健統計 に関するWHO (世界保健機関)の専門家委員会は,第6次報告書の中 で罹患率は以下の3つの単位で測ることができると述べている-病気にかかっていた人の人数 ?その人たちがかかっていた病気の種類 *その病気にかかっていた期間 _ 罹患率@ incidence rate A attack rate
病気でなかった人が特定の期間の間に病気を発症する率の尺度.
._ある期問に新たに病気になった二人の数__
その期問にその病気のリスクにさらされていた人口 として計算され,これは病気の出現の尺度となる.たとえば,1979年 における胎児アルコール症候群の罹患率は,出生1万あたり1であった が,1992年には出生1万あたり5になった.?有病数
発病率ともいう.特定の集?内,-定の期間内,あるいは伝染病が 流行しているような特殊な:伏況下における病気やある状態の罹患率のた めによく用いられる用語.具体的な例としては食中毒の発生があり,そ の場合,福患率は特別な食材を食べた人と食べなかった人に対して計算 される.罹患率はある期間危険因子にさらされていた人の数に対する同 じ期間に病気になった人の数の比で計算される.1999年にベルギーで 起きた有名ブランドのソフトドリンクでみられた食中毒症状の例では, 生徒280人中37人が症例として同定され,罹患率は全体で13.2%,男 子で15.6%,女子で8.9%であった.
驪リコ一ルバイアスrecahhbias =回想バイアス ■離散変数 discrete vadabies
整数値のみを値としてもつ変数.たとえば,妊娠数,抜歯数など.
_リジッ卜(idits吟リジット分析 ■リジッ卜分析ridit analysis
順序変数に対する解析方法の_-つで,順序のあるカテゴリー尺度は,背 後にある直接には計測できない連続変数の近似であるという仮定から出 発する.連続するカテゴリ一は,背後の連続量の隣り合う区-間に対応す ると仮定する.それぞれのカテゴリーに対してリジットと呼ばれる数値 を計算する.この値は,背後の変数の値が対応するぼ間の中点以下であ る確率の推定値である.このスコアを,その変数に対する次の解析で利 用する.
Patrick, D.L. and Erickson, P.,1993, Health Status and Health Policy ■ Allocating Resources to Health Care, Oxford University Press, New York.
■リスクrisk
不幸または損失が起こる確率.リスクはハザードの同義語である.医学 においてリスクを定量化し評価する際は,確率の計算と比較を伴うが, リスクの多くは害を受ける確率とその重大度の双方を表す複合尺度であ る.たとえば,米国人は約4000人に1人が交通事故死するリスクを背 負っている.つまり,致死的な重傷を受ける確率は,4000分の1であ る,
k Everitt, B.S., 1999, Chance Rules, Springer, New York.
11リスクに対して理性的になるよう一般大衆を説得することは大変に困難で
IIぁる.
國リスク集合risk set
生存時間解析で使われる用語で,ある特定の時刻の直前では生存してお り,打ち切りにもなっていない人たち.
■リスク人一年 person-years at risk
人と時間を統合した計測単位で,調査集団の被験者が調査中のアウトカ ムのリスクに曝露された時間(小数点ありの年単位)を合計したもの,
1リスク人-年は,1人が1年間曝露を受けたことに等しい.
Keyfitz, N.,1977, Applied Mathematical Demography, J.Wiley & Sons, New York.
國リスク評価risk assessment
あるリスクへの曝露,または好条件の欠如からくる心身の健康へのリス クの,定性的または定量的な評価.
Royal Society Study Group,1983, 7?^ Assessment / Report of a Royal Society Study Group, Royal Society, Ixmdon*
獲リスクファクタ一tisHactor =危険因子 醒率rate =比率 國リッジ回帰「idge「egression
説明蛮数間にf多重共線性の問題が考えられる場合に,これを克服する ために考えられた回帰分析の方法.多重共線性は,反応変数に対する説 明変数の個別の効果の推定を困難にする.?帰推定量にバイアスがある ことを認めることにより,この形の回帰では精度が向上する.
Rawlings, J.O., Pantula, S.G. and Dickey, D.A.,1998, Applied Regression Analysis : A Research Tool, Springer, New York,
圓リ一ドタイムlead thtne =先行期問
■リ一ドタイムバイアスheadhimebias=先行期間バイアス
■罹病mofbidify =榧患 國流行epidemic
ある疾病が,過去の経験から予測される地域的,時間的および人口的規 模をはるかに上回って生じること,
■流行曲線 epidemic curve
特定の集団と期間について疾病や他の健康に関連した事象の発現の時問 的変化をプロットしたもの?過去の経験から予測される程度をはるかに 上?って起こる大きくかっ突然の上昇は流行に対応することが多い.一 例を図76に小1した.?逆計算
Science,1991,25:i, 37-42
o 0 o o o o o o
0 o 0 5 3 2 1
鎰iJK酲助S ご^
0 LT r _ , - u u^u^llWJUJL ,
1885190019151930194519601975 1985
年
図76イングランドおよびウェ.一ルズ(1885?1985)におけ るインフルエンザ死亡数の流行曲線.
_流行の閾値ephdemhc thresholds
ヽ流行病モデルから生じた概念で,初期の感染可能人口が,疾患の蔓延 をコントロールするいくつかのバラメータによって決まるある限界値よ りも大きいときにのみ,ある人口集団の中で流行が'定着しうることをい う.流行が起こることを防ぐために予防接種が必要な感染可能者の割合 についての値を与えるので,実用上大きな意味がある.
Mollison, Dv 1995, Epidemic Models / Their Structure and Relation to Data, Cambridge University Press, Cambridge.
画流行の連鎖epidemic chain?感染の連鎖 國流行病モテルephdemic model
感染症が集団内に広がる動態を記述したモデル.決定論的なモデル,ラ ンダムな要素を含むモデルが考えられ,ある空間的枠組みの中での拡大 を説明する必要がある場合が多い,
Mollison, D.s 1995, Epidemic Models - Their Structure and Relation to Data, Cambridge University Press, Cambndge.
画両側検定 two-sided test
対立仮説が片方向だけでない検定.たとえば,ある母集団の平均値が別
の集団の平均値と異なるかの検定-?片側検定 _両極因子bipolacfadoi■?因子の?転 ■両極比率 extremal quotient
非負の観測値に対して,標本中の最大の観測値に対する最小の観測値の 比率として定義される.医学では通常,異なった地域における関心のあ る事象や処置の最大と最小の比率の比較に使用される.
Health Services Research, 1989, 24, 665- 84.
國リンク関数hink function ■??般化線形モデル ■臨床疫学 clinical epidemiology
疫学や他の分野で得られる方法を臨床的現象,特に診断,治療の決定と 結果の研究のために適用する学問.
Fletcher, R.H., Fletcher, S.W. and Wagner, E.H., 1996, Clinical Epidemiology, The Essentials, 3rd edn, Williams and Wilkins, Baltimore.
_臨床計量学chinimelrics
臨床医学における症候,身体的徴候,その他の臨床現象を記述したり測 定したりするために使われる指数や評価尺度の研究.
■臨床試験 clinical t「id
特定の疾患を有する患者に与えた内科的治療,外科的処置,あるいは治 療的指針の効果を評価するための1前向き研究?臨床試験は次のような4 つの段階への分類が確立されている.
?第I相試験:新しい薬剤に関する最初の臨床試験で,通常健常な志 願者を用いて安全性確認のために行う.
,第n相試験:第I相試験で薬剤の安全性が確かめられたならば,次 の段階は患者を用いて薬剤の最適用量を決め,その効果を検討する ための臨床試験を行う.
.第m相試験:複数施設での大規模な比較試験により現在使われてい る標準的な治療に対して安全性と効果を比較する.この試験は製造 許可申請を行うために必要である,
?第IV相試験:薬品が市販されたのち,安全性,効果および使用結果 についてさらに詳しい情報を得るために行う,
Meinert, C,L?1985, Clinical Trials : Design, Conduct and Analysis, Oxford University
Press, New York.
h#I毎年約8000件の臨床試験が行われている.無作為化臨床試験は,統計 学者による医学研究へのもっとも偉大な貢献であろう.
画臨寐試験結果報告のための標準化案consolidated shanda「ds of repo「hing tri- als (CONSORT) statement
t臨床試験の結果を報告するためのプロトコ一ル.このプロトコ一ルの 核となる工夫は,フロ一ダイアグラム(図77)とチェックリストであ る.フ■□一ダイアグラムをみると,評者と読者は,何人の試験適格者が 試験のそれぞれの枝に無作為的に割り付けられたかなどを素早く理解す ることができる.
? Jotirnal of the American Medical Association,1996, 276, 837-9.
11 ?藝臨床試験の報告を改善するために有効な試みであるが,形式的になりすぎ I "る傾向はある.
^登録済みあるいは有資格患者(n=…)j
無作為化なし(n=…)
理由(n=…)
R
割り付けられた標準的介入を受けた者(n=…) 割t)付けられた標準的介入を受けなかった者ト…)割り付けられた介入を受けた者0=…) 割り付けられた介入を受けなかった者(n=…)
I
経過追跡(nニ…)経過追跡(0=…)
1次および2次結果の時期1次および2次結果の時期
II
股落(n=…)脱落
介入効果なし(/■)=?)介入効果なし(/7=…)
追跡不能(/7=…)追fif不能…)
その他その他(n=…)
I
試験完了 …)| 試験完了(/7=…)
図77臨床試験結果報告のための標準化案.Rはランダム化 を表す.
國臨寐試験シミュレ一タdhnhcal t「ial simulator
実際の1臨床試験をモデル化するために用いられるコンピュータプログ ラム.このプログラムは,その背景と主な興味が統計学よりも医学にあ る人々に対して,異なるデザインと解析.意志決定の結果を具体的に示
リンショウ油4
すことができる.
_臨床試験の監査audit h clhnical trials
複雑なT臨床試験で集められたデータの質が高ぃことを保証する手順.
^ Controlled Clinical Trials,1995,16,104^36.
■臨床試験の品質管理clinical t「ids qualhty control
複雑なf臨床試験におぃて,単純な間違ぃや手抜き,あるぃはめったに なぃことだが,故意の欺瞞などによって生ずる誤りの可能性を排除する ため,収集したデータを監視する手続き.+臨床試験の監査
Controlled Clinical Trials,1981,17 327-32,
國臨床試験のプロトコ一ルchhnicalh「id protocol
1臨床試験を奥施するためのガイドライン.どのように試験を行うかを 明確かっ詳細に記述し,すべての研究者にそこで使われる方法を理解し てもらうようにする.特に1多施設共同試験では重要である.
Meinert, C.L.,1985T Clinical Trials 1 Design, Conduct and Analysis, Oxford University Press, New York.
驪臨床試験報告に対する統合基準CONSORT statement =臨床試験結果報 告のための標準化案
_臨床事前分布clinical pciocs?事前確率
■臨床的有意性と統計的有意性clinical vs stothstical significance
医学的研究で得た結果にっぃて,臨床的重要性と統計的検定によって得 た有意性が相反する場合がある.たとえば,大標本のデータ解析を行う と,臨床的にはほとんど意味をもたなぃわずかな差が統計的には有意と なることがある.ぃかなる所見に対しても,その実際の意味づけは臨床 的-統計的両側面を総合して判断しなければならなぃ.
Roberts, C .J., 1977, Epidemiology for Clinicians, Pittman Medical Publishing Company, Tunbridge Wells.
群間での4 mmHgの血圧の差(P< a〇5)が何らかの臨床的意味を もっていると主張するような研究者には注意した方がよい.標本数が大き くなればわずかな差でも統計的に有意となるのである.
■る.
_ 累積確率分布 cumulative probability distribution
与えられた値よりも小さい(あるいは大きい)確率変数がどれだけある かを示す分希.グループ化されたデータでは,与えられた値は階級の境 界値に対応する.
_ 累積度数分布 cumulcijlve frequency dish[ibution
標本値に対して,その値以下の標本総数を記録したもの.1累積確率分 布の実験データ版である,?度数分布
ホルモン濃度(nmol/7)
範R累?度数
75 ?791
80?M3
85 ?898
90 ?9417
95?卯27
100 ?10434
??10938
110 ?1M40
>11541
S累積ハザード関数cumulahhve hazard 死亡の累積確率.
_累積罹患数cumuhotivehncidence
最初は注Hした疾患の患者が1人もいない形で出発したコホートの中 で,きめられた年齢あるいは期間内にその病気を発症した人の割合.
=絶対リスク
圓累積罹患率cumulafivehnddence =累積罹患数 H累積罹患率比cumulahive incidence ratio =相対危険度 H累積和cusum
11?測値の系列を順次累積した和(cumulative sum)を示す頭字語.英験
計画では考慮していない場合でも,時間的な影響を知るために役立つこ とが多い.時間的なトレンドがなければ,基本的には累積和は平坦とな る.時間に伴う計測値のレベル変化は,累積和では傾きの変化として現 れる.図78に一例を示した.(訳者注:累積和は品質管理でよく使われ る手法で,ある基準値と観測値との差を順次加えながら時間軸にプロッ トする.)
? journal of Quality Techniques,1975, 7,183 ~ 92.
図78累?和の例,
圓類別交配 assortative mating =同類交配 _ルビ一ンの検定 Levene test
等分散性の検定で,観測値と群平均値の差の絶対値に対する*分散分析 を利用する.?バートレットの検定,ボックスの検定 ? Journal of the American Statistical Association,1974, 69? 364^7*
■れ_
■レキシス図Lexis diagram
死亡率などある率に対する2種類の時間尺度(通常,年齢と暦年)の影 響を表示するために工夫された関.たとえば,子宮頸がんの死亡率は f発病率が年齢により異なるため年齢により変わってくるが,治療や集 団スクリーニングなどが年ごとに変化するため暦年による影響もある, レキシス図は,2種類の時間尺度のそれぞれの時間帯の組合せに対応す る--連の長方形(または正方形)の領域からなる,2つの時間帯の組合 せに対応する死亡率は,患者の死亡をそれが起こった長方形に割り当て た上,患者がどれくらい長くその長方形にいたかを承す長方形内の総観 察期間で割ることによって推定できる.この図では長方形を異なるコホ ートが横切ることになり,研究者は年齢と期間の間隔のパターンを観察 できる.レキシス図の一例を図79に示す.■?年齢-期間~コホート分析 ? American Statistician, 1992, 46,113 -18.
レコードリンケージrecord linkage
ある患者の情報が複数の記録に含まれているときに情報を集める方法 で,同じ患者は一度しか数えられないことを保証する.
? Medical Care, 1994,32,1004-18.
薩レーターマンのモデルLedermann model
酒飲みの集団におけるアルコール消費量の確率分布のモデル.経験的な データによれば,アルコール消費量はf対数正規分布をする.
W Ledermann, S.,1956, Alcool, alcoohsme et alcoohsatton, Presses Umversitaires de France, Pans.
_ 劣性 recessive
同盟接合状態のときだけ,表現型として発現するf遺伝子.
?連runs
観測値の列で,ある同じ値が連続して起こること.たとえば, 111224333333という列では,4つの連があり,「4」は1個しかないので 長さ1の連と考える.
_連結関数hink function?一般化線形モデル S連鎖解析hhnkage analysis
既知の座の遺伝マーカが,疾患感受性に関係すると考えられている+遺 伝子と異なる染色体上にあるという仮説を検定するための方法,
? Ott, J., Analysis oj Human Genetic Linkage, Johns HopKins University Press, Baltimore.
_連鎖地図linkage map
与えられた種の染色体で,既知の遺伝子がどこにあるかを示す染色体地 図.
?連鎖2項モデルchain-binomial models
感染症の数学モデルの-'つ.感染症流行の任意の段階で,感染した個体 群と未感染の個体群が存在し,後者は次の段階で新たな感染個体を生ず ると仮定する.新たに感染する数は4?分布に従うと仮定する.その 結果,2?分布の連鎖が得られるが,各段階で新たな感染が生ずる確率 は,前の段階での感染個体数と未感染個体数とによって決まる.
^ Bailey, NXJ.f 1975, The Mathematical Theory of Infectious Diseases, Arnold, London. ■連続変数 continuous variable
計測機器の精度上の制限を除いて,計測値が特定の(有限個の)値に限 定されないような変数.体重,身長,体温,血?などがよい例である. このような変数では,線形ならば異なる位置での同じ大きさの差は等価 である.?カテゴリカル変数,測定尺度 _ 連続変数のカテゴリ一化 categorizing continuous vaciables
連続変数の数値を2個あるいはそれ以上のカテゴリーにグループ分けす る医学研究ではよく使われる方法.たとえば,年齢ならば「若年(く 40)」と「高年(&40)」のような離散変数に変換する.記述のために このようなグループ分けを使うことについては多分異議は出ないであろ うが,データ解析を進めていく場合には,この手順が本質的に極端な形
の測定誤差を導入するものであるので,深刻な問題を起こすことがあり, 避けるべきであろう, y British Journal of Cancer, 1991,64,975.
1;:9參見たところ,臨床研究者にきわめて人気があるが,できるだけ避けた方が
Iよい方法である.
画連続補正conhini/ify correcthon?イヱーツの分割表補正 H連による検定runs test
f系列相関を見つけるためによく使われる検定方法.この検定では,f連, もしくは正または負の残差が連続する個数を数え,次にその結果を独立 性の仮説のもとでの期待値と比較する.
? Rawlings, J,0+J Pantula, S.G* and Dickey, DA?1998, Applied Regression Analysis / A Research Tool, Springer, New York*
■ろL!
□イの最大粮Roylargest root?多変量分散分析
ロウエスlowess?局所重み付き回帰- _ ロウゼンバウムの検定Rosenbaum' s test
中央値が等しいことがわかっている2つの母集団の尺度バラメータが等 しいかを調べる1分布によらない方法.1検定統計量は,1番Eの母集団 の標本で,2番目の母集団の標本の最小値より小さいか最大値より大き いものの個数である.
國労働衛生occupationahhealfh =産業保健 _労働者少子化効果hnferthhe worker effect
子供をもつことで女性が仕事から遠ざかるという理由から,女子労働者 が不妊の傾向をもつという観察結果が生じること.?健廠労働者効 果
■漏斗プロットfunnel plot
系統的レビューにおいて,1出版バイアスの効果を評価するための簡略
□ゥ卜プロ?
法である.各研究のエフェクトサイズを%軸に,その標本数(または精 度の指標として効果の推定値の標準誤差の逆数など)をツ軸にとってプ ロットする.サンプリングのばらつきの性質により,出版バイアスがな ければ,このプロットは漏斗を伏せたようなピラミッドS!になるであろ う.出版バイアスがあると,効果が小さかったり,有意な効果が得られ なかった研究が選択的に除外されるので,このピラミッドが左右非対称 な形となる.このような研究は標本数が小さいときには多いが,標本数 が増すにつれて少なくなる.そのためこれらの除外例があるとピラミッ ドの左隅が欠けた形となるのである.図80にこのような例を示した.
? Everitt, B.S., 2002, Modem Medical Statistics, Arnold, London.
(a)
1 -
0
-1.5 一 1-0.500」5115
エフェクトサイズ
(b)
0
-1.5-1-0,500,511,5
8 6 4 2
糊-耕^-
10
エフェクトサイス'
図80(a)真の効果値を0としたシミュレーション研究35例
の漏斗プロット.エフェクトサイズの推定値は0.087で, 95%信頼K間は[-0.018, 0,178]である.(b) U)か ら左端5例を除いた場公の漏斗プロット.ェフュクトサ イズの推定値は01124で,95%信頼ぼ間は[0.037,0.210] となる(Duval and "Tweedie : /. Z肌 Sf此バ55此,2000, 95, 89-98から許可を得て掲載).
圍ログランク検定log-rank test
複数の被験者群のf生存時間を比較する方法で,まず事象が発生した時 刻ごとに死亡者の観測数と'f期待度数を計算する.1検定統計量は,簡単 にいうと,それぞれの時点における観測死亡数と,2群の生荏率が同じ と仮定したときの期待値との比較である.
Collet, Dm 1994, Modelling Survival Data in Medical Research, Chaumaiy and Hall/CRC, Boca Raton, FL
?ロジスティック回帰loghstic regression
2値の反応変数(たとえば,起こる?起こらない)に適した回帰分析の 方法で,fオッズの対数が説明変数の1次関数で表されるとモデル化す る.この形式の回帰を使うことにより,たとえば事象の確率を直接,説 明変数の1次関数で表すようなモデルで起こる問題を回避することがで きる.特にロジスティック回帰では,確率が[0,1]の区間外に?ては められることはない.回帰係数の推定値の指数をとれば,オッズの推定 値が得られる.
Hosmer, D* and Lemenshow, S.,1989, Applied Logistic Regression, J. Wiley & Sons, New York.
_ ロジット変換logit transfoirnath〇n
カテゴリー変数のfオッズの対数をとる変換で,T ロジスティック?帰の 基礎.
■ ロ一ゼンタ一ル効果 Rosenthal effect
人間による+バイアスを最小化するための厳重な安全策が組み込まれて いない限り,調渣者はしばしば自分が調査から見つけると期待していた ものを見つけるという現象.たとえば,胎児の心拍数に対して聴診器に よる測定と電気的な記録を比較した信頼性の研究では,病院のスタッフ は,真の心拍数が130/min以下のときは多めに,150/minだと少なめ に推定する傾向があることがわかった.
_ ロッズbds
疫学ではfオッズの対数の意味でしばしば使われる用語.また,遺伝学 では尤度比の対数の意味で使われる,
_ ロバスト回帰robust regression
モデルの仮定からの乖離に対する,母数推定の敏感度を減らすよう設計 された統計学的方法一般.たとえば,+最小2乘推定はtダ!^し値に敏感で あることが知られているが,平方和最小の基準でなく絶対値の和最小の 基準を使って推定をすれば,外れ値の影響を減らすことができる. k Huber, P.J,,1980, Robust Statistics, J. Wiley & Sons, New York,
圏ロバス卜統計量「obust statistics
統計的な手法や検定方法で,たとえもとにした仮定が少々(または中程 度)満たされていなくても,十分にうまく働くもの.たとえば,'スチ ューデントの(検定は正規性からの乖離に対して頑健(ロバスト)であ る.?高限界手法
? Launer, R. and Wilkinson, Gv 1979, Robustness in Statistics, Academic Press, New York.
_ a?レンツ曲線 Lorenz curve
曝露量が増加するときの人口の累積割合に対する症例の累積割合のプロ ット.曝露と疾病の関連の指標として使われる.馭点からのびる45度 の直線は,曝露と病気の間に関連がないことを意味する.?81に例を 示す,もし曝露量の増加に対して病気のリスクが単調に増加しない場合 は,累積割合を計算する前にデータをリスクの大きさの順に並べ替える 必要がある.この形の曲線と関速するものにジニ係数がある.これは対 角線と曲線の間の面積の2倍で定義される.ジニ係数は0と1の間の値 をとり,大きい値は曝露量によりリスクの差が大きいことを,小さい値 はリスクが曝露量によらず一定なことを意味する.
^ Economic Applications,1980, 33, 827-67.
〇
00.20.40.60.B1
相対累積人数
図81ローレンツ曲線の例.
鑾ロンジ一ニ-クープマンモテルLongini-Koopmanmodel
1次感染と2次感染のモデルで,感染症では家庭内で感染者のクラスタ 一ができやすいことから,感染率のt超2?変動がモデルのもとになっ ている.
^ Statistics in Medicine,1994,1563-74*
■
もっと勉強したい方は⇒統計学入門セミナー