Upgrade to Pro — share decks privately, control downloads, hide ads and more …

単施設でできる臨床研究の考え方

Avatar for Shuntaro Sato Shuntaro Sato
August 24, 2025

 単施設でできる臨床研究の考え方

単施設でできる臨床研究の考え方をまとめました.探索的研究と検証的研究を区別し,次につながる探索的研究を積極的におこないましょう.
スライドを利用する場合は,適切に引用してください.

Avatar for Shuntaro Sato

Shuntaro Sato

August 24, 2025
Tweet

More Decks by Shuntaro Sato

Other Decks in Research

Transcript

  1. 単施設研究のlimitation 4 Target population RQに対応する集団 = 標的集団 単施設から得られた結果は 標的集団から得られるであろう結果と同じ? •

    サンプルサイズが 小 さいことが多いので... • 不確実性が 大 きい(信頼区間が広い) • バイアスを 十 分に除けない • 単施設なので... • 測定 方 法や治療 方 法等が他施設をカバーできない
  2. 単施設研究のlimitationを解決するために① 5 Target population RQに対応する集団 = 標的集団 • サンプルサイズが 大

    きくなるので... • 不確実性が 小 さくなる(信頼区間が狭い) • バイアスを 小 さくできる • 単施設なので... • 測定 方 法や治療 方 法等が他施設をカバーできない • どこの施設でもこれらが同じと考えられるならばok • Discussionsには書く 方 が良いと思う サンプルサイズを 大 きくする
  3. 単施設研究のlimitationを解決するために② 6 Target population RQに対応する集団 = 標的集団 多施設研究にする • サンプルサイズが

    大 きくなるので... • 不確実性が 小 さくなる(信頼区間が狭い) • バイアスを 小 さくできる • 多施設でおこなうので... • (研究としては均 一 化は図りつつ) 測定 方 法や治療 方 法等の細かい違いもカバーできる
  4. 単施設でサンプルサイズを 大 きくしようとすると 7 サンプルサイズ 大 きくしたい!! どのぐらいサンプルサイズが必要ですか? 他の施設に 手

    間はとらせないけど,データ集 めに時間はかかるよね. そもそも仮説は正しそうなんですか?
  5. 医学研究のタイプ 1 3 記述 関連の探索 予測 因果推論 診断の性能評価 Descriptive Exploring

    associations Prediction Causal inference Evaluation of diagnostic performance 変数の分布は? アウトカムに関係して いる変数はどれ? アウトカムを予測する アウトカムに影響する か? スタンダードの 方 法と 比 較して,新しい 方 法の 性能はどうか? • Hernán MA, Hsu J, Healy B. A Second Chance to Get Causal Inference Right: A Classi fi cation of Data Science Tasks. Chance. 2 0 1 9 Jan 2 ; 3 2 ( 1 ): 4 2 – 9 . • Vittingho ff E, Glidden DV, Shiboski SC, McCulloch CE. Regression methods in biostatistics: linear, logistic, survival, and repeated measures models. Springer Science & Business Media; 2 0 1 1 . • 希少疾患であれば,記述研究(要約)だけでも意味がある • 早くまとめて発表して,他施設の仲間を募ろう
  6. 具体例 1 4 初診時に収縮期 血 圧が130 mmHg以上の患者さん 年齢 性別 喫煙歴

    脂質異常症 週当たりの運動週間 塩分摂取量 バイオマーカーA バイオマーカーB 初診時の 血 圧 3か 月 後の 血 圧
  7. 研究タイプにあてはめる 1 5 関連の探索 因果推論 予測 解釈性 操作性 • どの変数が

    血 圧と関係しているか? • 年齢が 高 いと 血 圧が 高 いか? • 初診時の情報で, 3か 月 後の 血 圧(or 変化量)を 予測する • 週当たりの運動を多くすると 血 圧の減少量は増えるか? • 週当たりの運動が多いと 血 圧の減少量は 大 きいか? 週当たりの運動を変えることにより, アウトカムを変えることを考えている • 塩分摂取量を減らすと 血 圧の減少量は増える か?
  8. 研究タイプに対応した研究 目 的を書き分ける 1 6 関連の探索 因果推論 予測 本研究の 目

    的は,初診時に収縮期 血 圧が130 mmHg以上の患者を対象に • 初診時から3か 月 後の収縮期 血 圧変化量に関連する要因を明ら かにすることである. • 初診時から3か 月 後の収縮期 血 圧変化量に新規バイオマーカー が関連するか明らかにすること である. • 初診時から3か 月 後の収縮期 血 圧変化量を予測するモデルを開 発することである. • 既存のモデルに新規バイオマー カーを加えることで,初診時か ら3か 月 後の収縮期 血 圧変化量 の予測性能が向上するか明らか にすることである. • 塩分摂取量を減らすことが,初 診時に対する3か 月 後の収縮期 血 圧を減少させるか明らかにす ることである. • 3か 月 後の収縮期 血 圧に塩分摂 取量が影響するか明らかにする ことである. • 一 貫して「関連」を使う • 「影響する」を使いたいけど我 慢する • 因果を 見 るときのみ「影響」 「効果」を使って良い • C-words • 「〜させる」といった操作を 意図する 用 語を使って良い
  9. 研究デザインのフレームワークはPECO (PICO)だけではない 1 7 デザイン 関連の探索 P: Population(集団) P: Predictor(関

    心 ある変数) O: Outcome(アウトカム) 予測 P: Population(集団) P: Predictor(予測に使う変数) O: Outcome(アウトカム) 因果推論 P: Population(集団) E: Exposure(曝露) C: Control(対照) O: Outcome(アウトカム) 観察研究は曝露,介 入 研究は介 入 (Intervention)
  10. 研究タイプのつながり 1 8 記述 関連探索 予測 因果推論 診断性能評価 複数の変数間の関 係に関

    心 がある • 予測することに意義 がある • それなりの予測確率 を得られそう • あるリスク因 子 に 注 目 したい • 操作性のある変数 である
  11. 検証的か?探索的か? 2 0 計画した仮説 データ 結果 解析 報告 仮説検証型 仮説

    結果 解析 報告 仮説 結果 解析 データ 仮説 仮説探索( 生 成)型 • 検証的研究 (Con fi rmatory / pivotal / de fi nitive study) • 明確に検証したい仮説がある • 検証するための情報が整っている • 結果の主張は強くできる • 探索的研究(explanatory study) • 介 入 試験であれば パイロット試験(pilot trial), フィージビリティ試験(feasibility trial) • 結果の主張は意識的に弱める • 「有効性(有 用 性)を検証する」とは 言 わない 仮説
  12. 因果推論タイプで,探索と検証を区別する 2 1 記述 関連探索 予測 因果推論 診断性能評価 複数の変数間の関 係に関

    心 がある • 予測することに意義 がある • それなりの予測確率 を得られそう • あるリスク因 子 に 注 目 したい • 操作性のある変数 である 内部検証→外部検証 探索→検証 探索→検証 • 基本的に観察研究は探索的研究 • 介 入 研究は 検証と探索にわけて考える
  13. 検証的研究の条件 2 2 統計的にサンプルサイズを 計算するための情報がある • アウトカムの尺度 • 群間差 •

    群間差のばらつき 検証的研究 探索的研究 大 事なアウトカムが 一 つに決まる 決まる 情報がある 決まらない ない 大 事な仮説が 一 つに決まる 決まる 決まらない • これらを決める, 集めるために探索的研究をする • 曖昧なまま無理して検証的研究をしない • 試験の実施に無理が 生 じる • リクルートできない • 主解析で統計的有意差が得られない • 統計的なサンプルサイズ設計は 生 物統計家にご相談を 群を無作為に割付けられる(RCT) 割り付けられる できない
  14. 検証的研究までのステップアップ 2 3 ① 関連探索により,アウトカムに対して操作性のある変数Xを 見 つける 関連探索 因果推論 ②

    観察研究データにより,変数Xがアウトカムに影響するか評価する • ①と②は同じデータで解析可能 ③ 検証的RCTと同じ設定で 小 規模なパイロットRCTをおこなう • シングルアーム試験は 非 常に中途半端→有効性 ・ 有 用 性には 言 及できない • 何も情報がないよりマシだが,統計的なサンプルサイズ計算に必要な情報は 足 りない • サンプルサイズが 大 きいならば観察研究で 二 群 比 較の 方 が良い • いろいろな理由からの最終 手 段として実施する ④ ③の結果をもとに,主要評価項 目 を決め, 統計的にサンプルサイズを計算し,検証的RCTをおこなう • 先 行文 献から③までの情報が揃っているならば,最初から検証的RCTを組める 実験的だからこそ 単施設の 方 がしやすい
  15. 探索的研究では,アウトカムに優先順位は不要 2 4 検証的研究 • アウトカムに優先順位をつける • 主要評価項 目 (Primary

    outcome)は1つ • 副次評価項 目 (Secondary outcomes) • 主要評価項 目 をサポートする項 目 • 仮説検定(多重性の調整)の対象を Key secondaryということもある 探索的研究 • 優先順位により,研究 手 順として 手 をかける ところと, 手 を抜くところをわける • 主要評価項 目 をベースにサンプルサイズ設計 をする 優先順位が決まらないなら探索的 • 評価項 目 に優先順位を設けなくて良い • 何が何でも主要評価項 目 を決めろという 査読者がいるので,緩くても優先順位が あるなら主要評価項 目 を定めても良い • 探索的研究により,注 目 すべき変数, 差が検出されやすい変数がわかる
  16. 医学研究をおこなう際の各種ガイドライン 2 7 • SPIRIT 2 0 2 5 は研究計画書のガイドライン

    • ランダム化 比 較試験 用 の研究計画書ガイドラインであるが, 観察研究の計画書作成にも参考になる • 他のガイドラインは • 検証的RCTの報告 用 : CONSORT 2 0 2 5 • 観察研究の報告 用 : STROBE • 予測研究の報告 用 : TRIPOD+AI • 多くのガイドラインはチェックリストと詳細な説明の2つの 文 書で構成
  17. CONSORT 2 0 1 0 statement: extension to randomised pilot

    and feasibility trials 2 8 Eldridge, S. M., Chan, C. L., Campbell, M. J., Bond, C. M., Hopewell, S., Thabane, L., Lancaster, G. A., & PAFS consensus group. ( 2 0 1 6 ). CONSORT 2 0 1 0 statement: extension to randomised pilot and feasibility trials. BMJ , 3 5 5 , i 5 2 3 9 . • CONSORT 2 0 1 0 (2025)は検証的RCTのガイドライン • このガイドラインは探索的RCTのガイドライン • Title,introduction,サンプルサイズの考え 方 ,書き 方 に注意する • パイロット(pilot)と実施可能性(feasibility)の 2つの 用 語があるが,明確に区別していない • 検証的RCTが実現できるか知る,あるいは実現させる ための 小 規模RCTのことを指す
  18. Introduction (item 2 a) 3 0 Standard CONSORT 科学的な背景と理論的根拠の説明 Extension

    for pilot trials 科学的な背景,将来的な検証的試験の根拠,パイロットRCTの理由の説明 • To undertake an RCT of patient management raises important practical concerns including: ... adherence to protocol. Thus, studies have adopted an approach of changing practice at the unit level in quality-improvement projects or stepwise cluster RCT. We performed this study to address whether an RCT of the management of RFM in individual patients was an appropriate trial design, and was feasible with regard to i) maternal recruitment and retention ii) patient acceptability, iii) adherence to protocol. In addition, we wished to con fi rm the prevalence of poor perinatal outcomes in the study population. Heazell, A. E. P., Bernatavicius, G., Roberts, S. A., Garrod, A., Whitworth, M. K., Johnstone, E. D., Gillham, J. C., & Lavender, T. ( 2 0 1 3 ). A randomised controlled trial comparing standard or intensive management of reduced fetal movements after 3 6 weeks gestation--a feasibility study. BMC Pregnancy and Childbirth, 1 3 , 9 5 . • 本研究を実施した 目 的は,個々の患者におけるRFM管理に関するRCTが,① 母 親の登録と脱落しないか,②患者の治療受容性,③ プロトコル遵守という観点から,適切な試験デザインであるか否かを評価するとともに,研究対象集団における周産期予後不良例 の発 生 頻度を確認することにあった。
  19. Introduction (item 2 b) 3 1 Standard CONSORT 目 的と仮説を特定する

    Extension for pilot trials パイロット試験の 目 的と臨床疑問を特定する • In this feasibility trial, the research aim was to explore trial design, sta ff and resident acceptability of the interventions and outcome measures and to provide data to estimate the parameters required to design a de fi nitive RCT. Stow, R., Ives, N., Smith, C., Rick, C., & Rushton, A. ( 2 0 1 5 ). A cluster randomised feasibility trial evaluating nutritional interventions in the treatment of malnutrition in care home adult residents. Trials, 1 6 , 4 3 3 . • このフィージビリティ試験における研究 目 的は,試験デザイン,スタッフおよび住 民 による介 入 の受容性,およびアウトカム指標 を検討するとともに,検証的RCTを設計するために必要なパラメータを推定するためのデータを提供することであった.
  20. Methods (item 7 a) 3 2 Standard CONSORT サンプルサイズの決定 方

    法 Extension for pilot trials パイロット試験における 人 数の根拠 • Since this was a pilot study, a sample size calculation was not performed. The researchers aimed for 1 2 0 participants because it was felt this would be a large enough sample to inform them about the practicalities of delivering several self- management courses led by patients with COPD, recruitment, uptake, and attrition. Taylor, S. J. C., Sohanpal, R., Bremner, S. A., Devine, A., McDaid, D., Fernández, J.-L., Gri ffi ths, C. J., & Eldridge, S. ( 2 0 1 2 ). Self- management support for moderate-to-severe chronic obstructive pulmonary disease: a pilot randomised controlled trial. The British Journal of General Practice: The Journal of the Royal College of General Practitioners, 6 2 ( 6 0 3 ), e 6 8 7 – e 6 9 5 . • 本研究はパイロット研究であるため,サンプルサイズの算出は実施していない.研究者らは,COPD患者主導による複数の 自己 管 理コースの実施可能性,参加者募集,参加状況,および脱落に関する知 見 を得るには120名の参加者数が適切であると判断し,こ の 人 数を 目 標とした。 • パイロット試験に必要なサンプルサイズに関する推奨に焦点を当てた 方 法論の論 文 の多くは, パイロット試験の主な 目 的は,効果の 大 きさとばらつきを推定し, 将来の検証的RCTのサンプルサイズ計算に役 立 てることであると想定している. 多いと思う CONSORTでも 言 及
  21. パイロットRCTのサンプルサイズの 目 安 3 3 Whitehead AL, Julious SA, Cooper

    CL, Campbell MJ. Estimating the sample size for a pilot randomised trial to minimise the overall trial sample size for the external pilot and main trial for a continuous outcome variable. Stat Methods Med Res. 2 0 1 6 Jun; 2 5 ( 3 ): 1 0 5 7 – 7 3 . • 標準化効果量(群間差/群間差の標準偏差)の範囲は0〜1 • 標準化効果量は観察研究データから 見 積もりたい • 目 安に過ぎない • イベントの発 生 割合が1%なら少なくとも1群100例は必要(それでもイベント発 生 しないかも) 標準化効果量δ (群間差/群間差の標準偏差) 1群のサンプルサイズ 検証的RCTの検出 力 を80%にしたい場合 検証的RCTの検出 力 を90%にしたい場合 非 常に 小 さい(δ < 0 . 1 ) 5 0 7 5 小 さい( 0 . 1 ≦ δ < 0 . 3 ) 2 0 2 5 中ぐらい( 0 . 3 ≦ δ < 0 . 7 ) 1 0 1 5 大 きい(δ ≧ 0 . 7 ) 1 0 1 0
  22. 探索的RCTの統計解析 方 法 3 4 • 群ごとに要約する • 群間差の平均値と標準偏差を算出する •

    これらの値を検証的RCTでの統計的サンプルサイズ設計に使う • 群間差の点推定値と95%信頼区間を推定する •仮説検定には意味がないのでしない • どうしてもしないといけない場合はMethodsのstatistical analysisに次の 文 を書く • Results for analyses should be interpreted as exploratory.
  23. なんとなくイメージする表 3 7 Variables Univariate analyses Multivariable analysis 1 )

    Coe ffi cient ( 9 5 %CI) Coe ffi cient ( 9 5 %CI) Age, years 0 . 1 6 ( 0 . 0 9 to 0 . 2 2 ) 0 . 1 7 ( 0 . 1 1 to 0 . 2 4 ) Sex Female - 1 . 2 (- 2 . 6 to 0 . 2 4 ) - 1 . 8 (- 3 . 0 to 0 . 5 8 ) Male Reference Reference Smoking Current - 1 . 3 (- 3 . 1 to 0 . 4 9 ) - 0 . 1 7 (- 1 . 7 to 1 . 3 ) Ever - 0 . 9 8 (- 2 . 7 to 0 . 7 2 ) - 0 . 9 (- 2 . 2 to 0 . 3 8 ) Never Reference Reference Dyslipidemia - 0 . 9 3 (- 2 . 4 to 0 . 5 1 ) 1 . 4 (- 0 . 0 8 to 2 . 9 ) Number of exercises per week 0 – 1 6 . 4 ( 4 . 9 to 7 . 9 ) 7 . 4 ( 5 . 4 to 9 . 3 ) 2 – 4 Reference Reference 5 – 7 - 0 . 8 3 (- 2 . 2 to 0 . 5 2 ) - 0 . 7 3 (- 2 . 0 to 0 . 5 5 ) Salt intake per day, g - 0 . 2 2 (- 0 . 6 6 to 0 . 2 1 ) 0 . 1 7 (- 0 . 3 1 to 0 . 6 5 ) Biomarker A - 0 . 0 3 (- 0 . 0 6 to 0 . 0 ) 0 . 0 (- 0 . 0 3 to 0 . 0 3 ) Biomarker B - 0 . 0 3 (- 0 . 0 5 to - 0 . 0 2 ) - 0 . 0 5 (- 0 . 0 7 to - 0 . 0 3 ) SBP at baseline, mmHg 0 . 3 2 ( 0 . 2 4 to 0 . 4 0 ) - 0 . 1 3 (- 0 . 2 8 to 0 . 0 1 ) 多変量解析! Table 2 . The association between outcomes and variables CI, Con fi dence interval; SBP, systolic blood pressure 1 ) Coe ff i cients were estimated using a multiple linear regression with all variables.
  24. 回帰モデルに含めたい変数の数を元にサンプルサイズを考える 3 8 EPV(Event per variable):モデルに含めても妥当と考える説明変数の数の 目 安 アウトカム EPVの計算

    方 法 具体例 連続 サンプルサイズ/20 • サンプルサイズが100ならば,説明変数の数の 目 安は5個 二 値 二 値の少ない 方 の数/10 • サンプルサイズは100 • イベントありが30,なしが70なら,30/10 = 3個 • イベントありが80,なしが20なら,20/10 = 2個 説明変数がカテゴリカルデータの場合は注意 • 二 値のカテゴリ変数(例:左右)なら,変数は1個とカウント • 三値のカテゴリ変数(例:低中 高 )なら,変数は2個とカウント • k値のカテゴリ変数なら,変数はk- 1 個とカウント
  25. 多変量回帰モデルは必要か? 3 9 血 圧 年齢 収 入 • 血

    圧は収 入 と本当は関係しない • 年齢により, 血 圧と収 入 のみで関係を評価すると「関連あり」 単回帰モデル • 収 入 を予測できれば,それで良い • 真に関係しているかに関わらず,単独でもアウトカムを予測 ・ 診断に寄与しているならOK 多変量回帰モデル • 他の要因とアウトカムとの関係を取り除いた上で,なお 血 圧が収 入 と関係しているか知りたい 多変量回帰モデルは必ず必要ではない
  26. 例で考えてみる 4 0 アイデア 回帰モデル 1 • すべてのリスク因 子 が

    血 圧変化に関係あるか同程度に知りたい • 診察時に3か 月 後に 血 圧が上がるか,さくっと知りたい • 関係しているならそれで良い • 真に関係しているか関 心 はない 単回帰 2 • すべてのリスク因 子 が 血 圧変化に関係あるか同程度に知りたい • 真に 血 圧変化と関係している変数を知りたい • 他の変数での調整に意味がある • EPVより,すべての変数を含んだ回帰をしても 大 丈夫そう 多変量回帰 すべての変数を含める 3 • バイオマーカーA, Bは新しく測定できるようになった • 他の要因は 血 圧変化に関係しているはわかっている • 他の要因を調整した上で,バイオマーカーが 血 圧変化と関連するか知りたい 多変量回帰 バイオマーカーA + 調整変数 バイオマーカーB + 調整変数
  27. サンプルサイズ,イベント数が 小 さいときにどうするか? 4 1 • 無理して多変量回帰はしない • P値基準で変数を選ばない •

    ステップワイズもしない • 単変量解析をする • methodで説明すれば良い • アイデア3に持ち込めないか検討する • 年齢,性別,重症度のみで調整する • 仮説検定は意味がないのでしない
  28. アイデア3の結果の 示 し 方 4 2 Variables Univariate model Multivariable

    model 1 ) Coe ffi cient ( 9 5 %CI) Coe ffi cient ( 9 5 %CI) Biomarker A - 0 . 0 3 (- 0 . 0 6 to 0 . 0 ) 0 . 0 (- 0 . 0 3 to 0 . 0 3 ) Biomarker B - 0 . 0 3 (- 0 . 0 5 to - 0 . 0 2 ) - 0 . 0 5 (- 0 . 0 7 to - 0 . 0 3 ) Table 2 . The association between outcomes and each biomarker CI, Con fi dence interval; SBP, systolic blood pressure 1 ) Analysis was performed using models including the following covariates for each biomarker: age, sex, smoking, dyslipidemia, number of exercise per week, salt intake, SBP at baseline. 注 目 している変数 のみ表に書く どのようなモデルで推定したか書く