上級・文献評価

システマティックレビューの読み方:
PICOとフォレストプロット解説

著者: PaperSearch編集部·公開: 2026年5月9日·更新: 2026年5月9日

読了時間:約11分

システマティックレビューとは何か

システマティックレビュー(systematic review, SR)は、特定の研究課題に関するすべての既存研究を 網羅的かつ透明な手順で収集・評価・統合した二次研究です。 エビデンスピラミッドの最上位に位置し、診療ガイドラインや政策立案の主要な根拠として使われます。

「ナラティブレビュー(narrative review)」とは根本的に異なります。 ナラティブレビューは著者の経験や専門知識に基づいて文献を選び解説するもので、 選択バイアスが入りやすく再現性も低いです。 システマティックレビューは事前に登録された研究計画書(プロトコル)に従い、 誰が実施しても同じ結果が得られる透明性が特徴です。

メタアナリシスはシステマティックレビューの一部として行われる統計的手法で、 複数研究の結果を統合して全体的な効果推定値を算出します。 すべてのシステマティックレビューがメタアナリシスを含むわけではなく、 研究間の異質性が高い場合は定性的統合のみで終わることもあります。

PICOフレームワーク:疑問を構造化する

システマティックレビューの出発点はPICO(またはPICOS)という形式で研究疑問を定式化することです。 曖昧な疑問を明確な検索戦略に変換するために不可欠です。

PPatient / Population

誰を対象にするか。疾患・年齢・性別・重症度など(例:成人の2型糖尿病患者)

IIntervention

何をするか。薬剤・手術・行動変容・スクリーニングなど(例:メトホルミン投与)

CComparison

何と比べるか。プラセボ・標準治療・他の介入など(例:プラセボまたは標準治療)

OOutcome

何を測るか。主要・副次エンドポイント(例:HbA1c低下・心血管イベント・副作用)

SStudy design

(オプション)対象とする研究デザイン(例:RCTのみ・観察研究を含む)

PICOを定式化することで、検索キーワードが決まり、どの研究を含める・除外するかの基準(inclusion/exclusion criteria)も 自然と導き出されます。PaperSearchで論文を検索する際も、PICOの各要素をキーワードに変換して入力すると効率的です。

PRISMAフロー図:文献選択の透明性

PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)は システマティックレビューの報告基準です。フロー図(flow diagram)は 文献選択の過程を視覚的に示したもので、次の4段階で構成されます。

  1. 1

    Identification(同定)

    各データベースで検索し、重複を除いた総数を示す。例:PubMed 1,234件+Embase 987件→重複除去後2,100件

  2. 2

    Screening(スクリーニング)

    タイトル・アブストラクトをレビューし、明らかに不適切な文献を除外する。2人の独立したレビュアーが行い不一致は協議で解決する

  3. 3

    Eligibility(適格性確認)

    全文を読んでPICO基準を満たすか最終確認する。除外した場合はその理由を記録する

  4. 4

    Included(採用)

    最終的に統合に含まれる研究数。量的統合(メタアナリシス)と質的統合の両方を示す場合もある

PRISMAフロー図が掲載されているかどうかは、レビューの透明性を評価する第一歩です。 図がない、または除外理由が不明な場合は方法論的品質に疑問が生じます。

フォレストプロットの読み方

フォレストプロット(forest plot)はメタアナリシスの結果を視覚化した図です。 各研究の効果推定値(四角)とその95%CI(横棒)、そして全体統合値(ダイヤモンド)が示されます。

図の読み方のポイントは以下の通りです。

中央の縦線(null line)

効果なし(差ゼロ、またはOR/RRなら1.0)を示す線。各研究のCIがこの線をまたぐ場合、その研究単独では統計的有意差なし。

四角のサイズ

各研究のウェイト(重み付け)を示す。大きいほど統合結果への貢献度が高い(サンプルサイズが大きい・精度が高い研究)。

ダイヤモンド

全研究を統合した効果推定値とCI。ダイヤモンドが null line をまたがなければ、全体として有意な効果あり。

I² 統計量

異質性の指標(後述)。フォレストプロット下部またはタイトル付近に記載される。

異質性(I²統計量)の解釈

I²(I-squared)統計量は「研究間のばらつきのうち、どれだけが偶然でなく真の異質性によるか」を0〜100%で示します。 メタアナリシスを行う前に必ず確認すべき重要な指標です。

I² < 25%

低異質性

研究間のばらつきは小さく、固定効果モデルも適用可能

I² 25〜75%

中等度異質性

慎重に解釈が必要。原因の探索(サブグループ解析)を行う

I² > 75%

高異質性

統合すること自体に疑問あり。個別研究を別々に解釈することが多い

異質性が高い場合、研究者は対象集団・介入の詳細・追跡期間などが異なる研究を無理に統合していないか確認します。 サブグループ解析で「なぜ異質性が生じているか」を探索することもあります。

バイアスリスク評価:RoBとGRADE

個々の研究のバイアスリスク(Risk of Bias, RoB)評価はシステマティックレビューの核心部分です。 Cochrane RoB 2.0ツールでは以下の5ドメインを評価します: ランダム化プロセス、介入からの逸脱、アウトカムデータの欠損、アウトカム測定、報告バイアス。 各ドメインを「低リスク」「懸念あり」「高リスク」の3段階で評価します。

GRADEシステム(Grading of Recommendations Assessment, Development and Evaluation)は、 エビデンス全体の確実性を「高・中・低・非常に低」の4段階で評価するフレームワークです。 バイアスリスク・非一貫性・非直接性・不精確性・出版バイアスの5つの要因でエビデンスの確実性を「格下げ」し、 用量反応関係や交絡が結果を弱める方向に働く場合は「格上げ」します。

診療ガイドラインでは推奨の強さ(強い・弱い)とエビデンスの確実性(高・中・低・非常に低)をセットで示します。 「強い推奨、低いエビデンス」という組み合わせは、エビデンスが弱くても 患者の価値観・好みや資源利用の観点から強く推奨される場合に見られます。

出版バイアスの確認:ファンネルプロット

出版バイアス(publication bias)は「有意な結果を示した研究は発表されやすく、 否定的な結果の研究は発表されにくい」という偏りです。 これによりメタアナリシスが実際より大きな効果を示す可能性があります。

ファンネルプロット(funnel plot)は各研究の効果量(横軸)と標本誤差の逆数(縦軸)を散布図にしたものです。 バイアスがなければ逆漏斗形(左右対称)になります。非対称な場合は出版バイアスを疑います。 Egger検定やBegg検定で非対称性を統計的に評価することも可能ですが、 研究数が10本以下では検出力が低く参考程度とします。

まとめ

  • システマティックレビューは網羅的・透明・再現可能な手順で複数研究を統合する最上位エビデンス
  • PICOで研究疑問を構造化すると検索戦略と適格基準が明確になる
  • PRISMAフロー図は文献選択の透明性を保証する重要な指標
  • フォレストプロットのダイヤモンドがnull lineをまたがなければ全体的な効果あり
  • I²が75%を超える高異質性の場合、統合結果の解釈に慎重さが必要
  • RoB評価とGRADEで個々の研究と全体エビデンスの確実性を評価する
  • ファンネルプロットの非対称は出版バイアスの可能性を示唆する