EBM

診療ガイドラインの読み方
推奨グレードとGRADEを理解する

著者: PaperSearch編集部·公開: 2026年5月9日·更新: 2026年5月9日

読了時間:約12分

診療ガイドラインとは何か

診療ガイドラインは、特定の疾患や臨床課題について、利用可能なエビデンスを整理し、医療者と患者の意思決定を支援する文書です。単なる教科書ではなく、臨床上の問いに対して推奨を示す実践的な道具です。

ガイドラインは、専門学会、研究班、公的機関、国際組織などが作成します。作成委員会には、該当領域の専門家だけでなく、方法論専門家、疫学者、薬剤師、看護師、患者代表が参加することもあります。

質の高いガイドラインでは、臨床疑問、文献検索、エビデンス評価、推奨作成、利益相反管理、外部評価、更新計画が明記されます。誰が、どの根拠に基づき、どのような手順で推奨を作ったかを確認することが大切です。

推奨グレードの読み方

多くのガイドラインでは、推奨の強さをA、B、C、Dなどのグレードで示します。一般にAは強く推奨、Bは推奨、Cは条件付きまたは十分な根拠がない、Dは推奨しないという意味で使われますが、定義はガイドラインごとに異なります。

推奨グレードは、エビデンスの質だけで決まるわけではありません。治療効果の大きさ、副作用、患者の価値観、医療資源、費用、実施可能性も考慮されます。RCTが存在しても、害や負担が大きければ推奨は弱くなります。

グレードを読むときは、文字だけを見て判断せず、推奨文、解説、根拠となる研究、適用対象を一緒に確認します。「推奨する」と書かれていても、対象患者、重症度、併存疾患、治療環境が限定されていることがあります。

古いガイドラインでは、推奨グレードとエビデンスレベルが混在している場合があります。研究デザインの強さを示す記号なのか、臨床で実施すべき強さを示す記号なのかを区別しないと、読み違いが起こります。

GRADEシステム:エビデンスの確実性評価

GRADEは、エビデンスの確実性と推奨の強さを透明に評価するための国際的な枠組みです。エビデンスの確実性は、高、中、低、非常に低の4段階で示され、アウトカムごとに評価されます。

RCTは通常「高」から評価を始めますが、バイアスのリスク、不一致、非直接性、不精確さ、出版バイアスがあれば評価を下げます。観察研究は通常「低」から始まりますが、効果が非常に大きい場合などには評価を上げることがあります。

GRADEの重要な点は、単一の総合評価ではなく、患者にとって重要なアウトカムごとに判断することです。死亡、入院、症状改善、副作用、生活の質などは、同じ介入でもエビデンスの確実性が異なる場合があります。

ガイドラインの表に「エビデンスの確実性:低」と書かれている場合、それは効果がないという意味ではありません。将来の研究で推定効果が変わる可能性が高い、または現在の根拠に不確実性が残るという意味です。

推奨の強さと患者・医療者への影響

推奨の強さは、医療者がどの程度その方針を標準的に選ぶべきか、患者にどの程度強く勧められるかを示します。強い推奨では、多くの患者にとって望ましい効果が害や負担を上回ると判断されています。

条件付き推奨または弱い推奨では、患者の価値観や状況によって選択が分かれる可能性があります。たとえば、延命効果は小さいが副作用が大きい治療では、患者が何を重視するかによって妥当な選択が変わります。

医療者にとって、強い推奨は標準診療として説明しやすい一方、弱い推奨では共有意思決定がより重要になります。選択肢、期待される効果、不確実性、負担を患者に説明し、患者の希望を反映させます。

推奨は、医療の質指標や保険制度、病院内プロトコルに影響することがあります。ただし、ガイドラインの推奨は個別患者を機械的に扱うための命令ではなく、臨床判断を支える標準的な参照点です。

ガイドラインの限界と個別患者への適用

ガイドラインは平均的な患者集団に基づく推奨を示しますが、目の前の患者がその集団と同じとは限りません。年齢、併存疾患、妊娠、腎機能、生活環境、服薬状況、価値観によって、推奨の適用可否は変わります。

臨床試験では、高齢者、重症患者、複数疾患を持つ患者が除外されることがあります。そのような患者に推奨を適用する場合は、根拠の直接性が下がるため、期待される利益と害を個別に検討する必要があります。

ガイドラインは作成時点の知識に基づいています。新薬、安全性情報、診断技術、医療制度が変わると、推奨が古くなることがあります。特に急速に研究が進む領域では、発行年と更新状況を必ず確認します。

また、利益相反や専門家集団の偏りが推奨に影響する可能性もあります。資金源、委員の利益相反、患者参加の有無、外部レビューの有無を確認すると、ガイドラインの信頼性をより適切に評価できます。

日本のガイドラインと海外ガイドライン

日本ではMindsが診療ガイドライン作成と評価に関する情報を提供しており、多くの国内ガイドラインを検索できます。日本の医療制度、薬剤承認、保険適用、診療体制を反映しているため、国内実践では重要な参照先になります。

海外では、英国のNICE、米国のACC/AHA、USPSTF、WHOなどが影響力の大きいガイドラインを公開しています。透明性の高い方法論、医療経済評価、患者参加が重視されているものも多く、国内ガイドラインと比較する価値があります。

ただし、海外ガイドラインをそのまま日本の臨床に適用できるとは限りません。薬剤の用量、承認状況、検査へのアクセス、保険制度、患者背景、医療資源が異なるため、推奨の前提条件を確認する必要があります。

複数のガイドラインで推奨が異なる場合は、臨床疑問、検索期間、採用研究、アウトカムの重みづけ、費用評価、専門家判断の違いを比べます。相違点を理解することで、単に多数決で選ぶより深い判断ができます。

アップデート確認とEBMとの関係

ガイドラインを使う前に、発行年、改訂年、部分改訂の有無を確認します。学会サイト、Minds、NICE、専門領域の公式ページ、PubMedで最新版を探し、古い版を引用していないか確認します。

重要な新規RCT、メタアナリシス、安全性警告が発表されると、ガイドライン本文より先に臨床判断が変わることがあります。特に薬剤、医療機器、感染症、がん治療では、最新論文や規制当局の情報も併せて確認します。

EBMは、研究エビデンス、臨床専門性、患者の価値観を統合する考え方です。ガイドラインは研究エビデンスを整理した強力な道具ですが、EBMそのものを置き換えるものではありません。最終判断には患者固有の情報が必要です。

ガイドラインを適切に読む力は、論文を読む力とつながっています。推奨文だけでなく、根拠となる研究デザイン、アウトカム、エビデンスの確実性、適用条件を確認することで、臨床判断の透明性が高まります。

AGREE IIを用いたガイドラインの質評価

AGREE II(Appraisal of Guidelines for Research and Evaluation II)は、診療ガイドラインの作成過程と報告の質を系統的に吟味する国際的な評価ツールです。23項目を、適用範囲・目的、利害関係者の参加、作成の厳密さ、提示の明確さ、適用可能性、編集の独立性という6領域に分け、推奨文が明快であるだけでなく、検索方法や利益相反、実装上の障壁まで示されているかを確認します。

評価者は各項目を「全くあてはまらない」1点から「強くあてはまる」7点までで採点し、領域ごとに得点を標準化して比較します。総合点だけで機械的に採否を決める道具ではありませんが、たとえば「作成の厳密さ」や「編集の独立性」が低いガイドラインでは、根拠の選び方や推奨形成に不透明さが残り、推奨事項を臨床判断に用いる際の信頼度を下げて考える必要があります。

日本語で実施する場合は、Mindsガイドラインライブラリの「AGREE評価ツール」ページからAGREE II日本語版PDFを入手し、対象ガイドライン本文、付録、利益相反開示、検索式をそろえます。可能であれば複数名が独立して23項目を採点し、領域得点と相違した判断理由を記録してから、利用を推奨できるかという全体評価を合議します。

日本と海外のガイドラインの違い

日本ではMindsが、GRADEアプローチを踏まえた作成方法、公開ガイドライン、評価ツールを提供しています。現行のGRADEに沿うガイドラインでは、推奨は主に「強い」「弱い(条件付き)」と方向で示されますが、国内の学会ガイドラインや旧版にはA〜Dなど独自の推奨グレードを用いるものもあります。したがって、文字の順位を読み替える前に各文書の定義表を確認します。

英国のNICEは医療経済や実施可能性を明示的に扱い、循環器領域のAHA/ACCやESCは国際的な研究集団と専門家委員会を背景に更新を重ねています。日本の文書は、承認薬、保険適用、検査へのアクセス、診療提供体制に即した判断を示せる点が重要です。十分な比較試験が少ない領域では、国内の臨床経験や専門家コンセンサスが推奨の補助となる場合もあります。

日本語版と英語圏のガイドラインで推奨が異なるときは、単純に新しい方や権威の高い団体を選ぶのではなく、対象患者、アウトカム、文献検索終了日、薬剤の承認状況、費用や資源の前提を並べて確認します。根拠となる研究は共通でも制度上の実行可能性が異なることがあり、日本の患者に適用する理由と適用しない理由を説明できる形で判断することが大切です。

個々の患者へのガイドライン適用の注意点

ガイドラインの推奨は、採用された研究に含まれる「平均的な患者」を想定した出発点です。実際の患者が、重い合併症を持つ、高齢で複数薬を服用している、妊娠中である、腎機能や肝機能が低下しているなど、研究の除外基準に近い場合、期待される利益と害は変わります。推奨の強さが高くても、対象集団との違いを確認せず適用することはできません。

そこで重要になるのが共有意思決定(Shared Decision Making: SDM)です。医療者は複数の選択肢、効果の大きさ、不利益、不確実性、通院や費用の負担を説明し、患者が重視する生活目標や許容できるリスクを聞き取ります。条件付き推奨では特に、同じ根拠を読んでも患者の価値観によって選択が変わり得ることを記録し、納得できる方針を一緒に決めます。

スポーツ選手やアスリートでは、復帰時期、再受傷リスク、競技規則、シーズン日程、パフォーマンス維持が意思決定に加わります。一般成人向けの治療やリハビリのガイドラインは競技者を十分に組み入れていないことが多く、同じアウトカムでも意味が異なります。競技特性を理解する専門職と連携し、競技復帰を含む個別の目標に沿って推奨を補正します。

ガイドラインのアップデートを確認する方法

診療ガイドラインは、重要な比較試験、安全性警告、新しい薬剤や医療機器、制度変更を受けて改訂されます。旧版を参照し続けると、現在は推奨されない治療を勧めたり、新たに示された害や代替選択肢を患者に説明できなかったりする危険があります。引用前には、本文の発行年だけでなく、部分改訂、追補、取り下げ、後継版の有無まで確認します。

国内文書はMindsガイドラインライブラリで疾患名を検索し、掲載版の発行年、公開元学会へのリンク、関連する最新版がないかを確認します。海外文書では、NICEの各ガイドラインページにある公開日・最終更新日と「Update information」を確認し、AHA/ACCやESCは公式ガイドライン一覧と更新通知を追います。過去に提供されていた検索サービス名だけを頼りにせず、発行団体の現行ページを一次情報として確認する方法が確実です。

更新が近い領域では、PubMedのフィルターやClinical Queriesでsystematic review、clinical study、発行年を絞って新しい根拠を確認します。PaperSearchでも、clinical guideline 2024 anterior cruciate ligament injury prevention のように、英語の主題語と発行年を組み合わせて検索すると、PubMedやOpenAlexなど複数ソースの候補を一度に比較できます。見つけた文書は必ず公式掲載版と照合します。

まとめ

  • 診療ガイドラインはエビデンスに基づく意思決定を支援する文書
  • 推奨グレードはエビデンスの質だけでなく利益、害、価値観、資源も反映する
  • GRADEではアウトカムごとにエビデンスの確実性を評価する
  • 強い推奨と弱い推奨では、患者との意思決定の重みが異なる
  • ガイドラインは平均的集団の推奨であり、個別患者への適用には臨床判断が必要
  • 日本のMindsと海外のNICE、ACC/AHAなどは前提条件を比較して読む
  • 発行年と更新状況を確認し、古い推奨をそのまま使わない
  • EBMではガイドライン、臨床専門性、患者の価値観を統合する