「交絡因子に適切に対処できていますか?」
疫学を学ぶ中で、私は何度もこの問いに向き合いました。
臨床研究でよく用いられる研究デザイン“コホート研究”では、被験者をランダムに割り付けることができないため、交絡(confounding)を常に意識する必要があります。例えばかつて、複数のコホート研究において「ホルモン補充療法は心血管疾患を予防する」と報告され、欧米では2000年頃までホルモン補充療法が広く行われていました [1]。しかし、実際にはホルモン補充療法を受ける人ほど社会経済的地位が高く、もともと心疾患のリスクが低かったため、そのような関連が観察されていたにすぎません。この仮説は、のちに行われた大規模なランダム化比較試験(社会経済的地位などの交絡因子の影響を受けにくい研究デザイン)によって覆され、むしろ「ホルモン補充療法は心血管疾患(静脈血栓塞栓症)のリスクを高める」ことが示唆されました[2]。このように、交絡因子を適切に扱わなければ、実際には因果関係のない“見かけ上の関連”が生じ、医療現場に深刻な不利益を招くおそれがあります。
「The scandal of poor epidemiological research」[1]では、この交絡の問題が詳細に論じられています。特に、交絡因子の選定理由が不明瞭で、統計モデルも一貫性に欠けることが多いと指摘されています。さらに、複数の暴露、結果、サブグループを考慮した多重検定により、統計的に有意な“偶然の産物”が見つかってしまいます。その結果、多くの研究において、全体の20%以上の結果が誤っている可能性があり、本来想定される偽陽性(p<0.05)5%を大きく上回っています [3]。これらは今でも多くの疫学研究に当てはまる問題です。
交絡の問題は統計解析だけではありません。データの収集段階においても、交絡因子の測定方法が、補正を困難にすることがあります。例えば、体重を体重計で測るのではなく、質問票で自己申告させた場合、実際よりも軽い体重が申告される可能性があり(例:女性は平均2.5 kg、男性は平均1.8 kg軽く申告 [4])、体重計で測定した真の値とは乖離してしまうことがあります。また、学歴についても、「中卒・高卒・大卒」というカテゴリー選択肢と、「○○学校卒」など自由記述を求める形式とでは、取得できる情報の正確さが異なる(後者がより正確である)場合があります。このように、質問票の設計段階から交絡を意識し、調査項目の測定精度を高める工夫が求められるのです。
このような問題をもとに、STROBE(観察研究)やCONSORT(ランダム化比較試験)、PRISMA(メタアナリシス)などの研究報告のガイドラインが作成されました。例えば、STROBEでは、研究者が「なぜこの交絡因子を選び、どのように調整したか」「結果の解釈においてどんなバイアスの可能性があるか」などを明確に記述することが求められます。これらは単なる形式的なテンプレートではなく、研究の信頼性や再現性の向上、そして標準化された枠組みのもとでの批判的評価を可能にする重要な基盤だと思います。
整形外科の臨床現場で得られるデータをもとに行う臨床研究は、現実の医療に根差した重要な知見を生み出す可能性があります。しかしそれは同時に、「交絡」という見えにくい落とし穴や、誤った報告が医療にもたらすリスクと常に隣り合わせであるという課題もあります。だからこそ、人々の健康と医学の発展に真に貢献するためには、正確で慎重な臨床研究の積み重ねが欠かせません。その複雑さと緻密さにこそ、私は臨床研究の奥深さと面白さを感じています。
参考文献
1. von Elm E, Egger M. The scandal of poor epidemiological research. BMJ. 2004;329:868–9.
2. Hulley S, Grady D, Bush T, et al. Randomized trial of estrogen plus progestin for secondary prevention of coronary heart disease in postmenopausal women. Heart and Estrogen/progestin Replacement Study (HERS) Research Group. JAMA. 1998 Aug 19;280(7):605-13.
3. Ottenbacher KJ. Quantitative evaluation of multiplicity in epidemiology and public health research. Am J Epidemiol. 1998;147:615–9.
4. Shields M, Gorber SC, Tremblay MS. Methodological issues in anthropometry: Self-reported versus measured height and weight. Proceedings of Statistics Canada Symposium 2008.