平成１２年度特別講習会

論文の具体例から学ぶ実践的統計法

岡村　智教（福祉保健医学講座）

具体例とする参考文献
Moriyama Y, Okamura T, et al. A low prevalence of coronary heart disease among subjects with increased high-density lipoprotein cholesterol levels, including those with plasma cholesterol ester transfer protein deficiency. Prev Med 1998; 27: 659-667

１．研究デザインについて（対象の抽出方法と時間軸で分類）

　(1)断面研究(最も多い研究手法)、(2)症例・対照研究、(3)追跡研究
　RCT（無作為化比較対照試験）も広い意味では(3)に入るが、一般的に追跡研究のうち観察研究（介入を行わない）のことをコホート研究と呼ぶ。また通常、症例・対照研究として学会発表されているものの多くは断面研究である。
　どうして科学的研究には統計が必要とされるのか（有意差とは何か？）

２．量的変数の解析

1)ある変数の分布を要約する→平均値と標準偏差（正規分布の時に有用）、
　　　　　　　　　　　　　　他に中央値、最頻値、4分位、最大値、最小値
　正規性の検定は厳密に適応すると実用性がなくなるが（ほとんどの統計量が正規分布ではないとされてしまう）、上記の項目をチェツクして分析対象としている変数の構造をチェツクしておき、著しく異なっていれば調整が必要。対数変換、ノンパラメトリック検定等。
例）参考文献データの各変数の分布（総コレステロール、HDLコレステロール、収縮期血圧値、飲酒量、喫煙本数）

2)２群の平均値の差の検定
　平均値の検定の考え方　(1)正規性を仮定するかどうか（ノンパラメトリック検定を用いるかどうか）、(2)対応があるかないか、(3)等分散かどうか、を順序だてて考えていく。例）参考文献における検定結果
　飲酒量、喫煙本数については正規性を仮定できないと想定された
　→Wilcoxonの順位和検定を用いる（順序尺度時のMann-WhytneyのU検定と同じ）
　コレステロールやHDLコレステロールなど他の平均値はｔ検定を用いる（StudentかWelchかはLeveneの検定で判断した）

3)補足；3群以上の検定
　なぜt検定の繰り返しはいけないのか？
　１：１の関係に持ち込むか、多群の検定（一元配置分散分析またはKrsukal-Walli検定＋多重比較）を実施する。研究の目的によって多重比較実施の有無を検討する（閾値を探りたい時は必須。傾向性が明らかな時や直線的関係をみたい場合は不要。
例）HDLコレステロールと歩行習慣の関連（動脈硬化 1994; 21:585-589）

３．質的（離散）変数の検定

　質的変数の検定は２×２表が基本であり、２×２表以上（例えば３×３表など）については「両群の分布は有意に異なっている」という結論しか出せないものが多い（うまく２×２表に変換するのがコツ）。対応のない場合は、有名なカイ２乗検定を用い、対応のある場合はMcNemar検定を用いる（これは量的変数の正規性を仮定しない場合かつ対応のある場合の符号検定と理論的に同一である）。
○医学統計の場合、必ず平均値のみではなく分布もみる（断面研究の場合必須）。
　例）参考文献における質的変数の取り扱い
　平均値は量的変数；虚血性心疾患群と正常群で収縮期血圧の平均値は差がない
　分布は質的変数；虚血性心疾患群は正常群に比し有意に高血圧者の割合が高い
　→最終的な解析に血圧の要素をどう投入するかを決定する判断材料になる（実測値を入れた場合、実態を反映しない可能性あり）。
　考察）同じ文献で総コレステロールはどう解釈できるか？

４．年齢調整という概念

　なぜ年齢調整する必要があるのか？→性、年齢の制御は統計の基本
　臨床医学統計では相対危険度（relative risk）のみではなく絶対危険度(absolute risk)も表示することが望ましい。表示する際に粗の率で示す場合と、年齢（場合によっては性も）調整率を示す場合がある（研究対象集団の年齢の分布範囲でどちらかを選ぶ）
考察）相対危険度3.0 （10万人に１人の病気が３人＝1000人に100人の病気が300人）
○年齢調整の基本は基準群を決めること
　基準群の年齢分布、比較群の年齢別発症率（有病率、死亡率）を使用する（直接法）。基準群の年齢別発症率（有病率、死亡率）、比較群の年齢分布を使用する（間接法）。ただし少数例の場合は基準群の設定の仕方で結果が大きく変動する。
　統計学的に両者を併合する方法としてはMantel-Haenszel法があり、これは２つのクロス表を結合して両者の比を求めるものである。カラムごとに基準群との比を求め、基準群の粗率を乗じれば年齢調整率が求められる（参考文献のグラフ参照）。また最初から多変量解析を用いて年齢調整相対危険度を求め、基準群の粗率に乗じる方法もある。要するに得られたリスクが集団の中で何％くらいに関係があるのかを示す。参考文献では、男性で総コレステロールが260mg/dl以上かつHDL39mg/dl以下の人では、約10人に1人が虚血性心疾患の既往歴を有することを示している。

５．断面研究における多変量解析

　断面研究における多変量解析は、(1)線形重回帰、(2)ロジスティック回帰、の２つに大別される。要するに従属変数（目的とする変数）が連続変量（平均値で示されるもの）か、離散変量（病気の有無など）によって異なる。ただし離散変量の場合は有りか無しかの２つに変数を絞る必要がある（3変数以上になると非常に難しい統計が必要）。参考論文は、従属変数が虚血性心疾患の有無でありロジスティツク回帰を用いている。

先頭へ

Last Updated 2005/8/8