統計 診断検査

診断検査について考える【感度・特異度・的中度】

Googleアドセンス




今回は、診断検査に関する感度・特異度という用語について考えていきたいと思います。

早速ですが、皆さんに1つ問いかけをしたいと思います。

腰椎椎間板ヘルニアの対する診断検査の1つに、Straight leg raising:SLR と呼ばれるテストがあります。


黒澤大輔. 腰痛に対する徒手検査. 関節外科 Vol.39 No.1. p6-16.2020より

SLRは、下肢を挙上させて坐骨神経を伸長させることで、腰椎椎間板ヘルニアの症状を誘発するテストです。

この診断テストの感度95%・感度30%と仮定した場合、以下の2つのシチュエーションにおいて

臨床的に意義のある結果はどちらでしょうか?

1. 患者にSLRを実施し、陽性だった

2. 患者にSLRを実施し、陰性だった

※SLRの感度・特異度に関しては、問題の為に仮想の数値を設定しています。

この問いにスムーズに答えられる人は、今回投稿を読む必要はありません。

・・・と言いたいところですが、実際には感度・特異度に関しては限界もあります。

本来、上の答えには簡単に答えられないと私は考えています。

そこで、今回は診断検査に関わる感度・特異度に関する以下のような内容をまとめていこうと思います。

  • 真陽性/真陰性・偽陽性/偽陰性
  • 感度・特異度とは
  • 確定診断と除外診断
  • 感度・特異度の限界
  • 陽性的中度・陰性的中度

私はPT/ATであり、医学的な診断を下せる立場ではありません。様々な検査を元に医学的な診断を下すのは医師の業務(医業)であり、PT/ATが実施できる業務ではありません。

今回の投稿は、あくあでも医師と共通言語を持ち医学的な検査に対する理解を深める為の情報整理である事を御理解下さい。

感度・特異度とは?

まず、感度(Sensitivity)・特異度(Specificity)の定義について説明したいと思います。

○感度
実際に病気の人のうち,スクリーニング検査で陽性と判定された人の割合

○特異度
実際には病気でない人のうち,スクリーニング検査で陽性と判定された人の割合

千葉康敬. 「医療統計力」を鍛える!. p228. 総合医学社. 2015.


なかなかイメージが沸かないと思いますので、先ほど例に挙げたSLR(感度95%・特異度30%と仮定)を元に考えていきましょう。

実際に腰椎椎間板ヘルニアである患者100名・ヘルニアの無い健康な人100名に対し、それぞれSLRを実施します。

SLRの結果は、以下の様になるはずです。

腰椎ヘルニアを患っている人100名に対しSLRを実施したら、95名(95%)は検査が陽性となります。

一方、ヘルニアの無い健常人100名に対しSLRを実施したら、30名(30%)は検査が陰性となります。

ここだけ見ると、陽性になる確率が高いので、SLRが陽性になった方が臨床的に意義が高いと思いたくなりますね。

しかし、そんなに話は簡単ではありません。

上のように、実際に病気の人を正しく陽性と判定する事を真の陽性(True Positive:TP)

逆に、実際には病気でない人を正しく陰性と判定する事を真の陰性(True Negative:TN)と言います。

しかし、上記のような場合だけでなく、検査結果が間違いだったケースも考えなくてはいけません。

実際には病気でない人を間違って陽性と判定する事を偽陽性(False Positive:FP)

実際には病気である人を間違って陰性と判定する事を偽陰性(False Negative:FN)と言います。

文字ばかりの説明では頭の中が混乱してしまうので、一度図示してみたいと思います。

上のような2×2の表を用いると理解しやすいのですが、私には分かりやすく図示するスキルがありません苦笑

申し訳ありませんが、この表で陽性・陰性や感度・特異度に関して頭の中を整理して下さい。


診断検査による除外診断

では、ここで先ほどのSLRの例を再度提示してみたいと思います。

今後は、先ほどと見方を変えて偽陽性・偽陰性の側面から検査結果を考えていきましょう。

実際には、腰椎椎間板ヘルニアの人が間違って陰性と判定される偽陰性の確率は5%です。

一方、ヘルニアの無い健常人が間違って陽性と判定される偽陽性の確率は70%もあります。

つまり、SLRの結果が陽性だった場合は間違い(偽陽性)の確率が高いのでアテにならないと考えられます。

逆にSLRの結果が陰性だった場合は間違い(偽陰性)の確率が低いのでアテに出来ると考えられます。

黒澤大輔. 腰痛に対する徒手検査. 関節外科 Vol.39 No.1. p6-16.2020より

実際に現場でSLRを実施している方は肌感覚で分かる事なのですが、SLRは様々な原因によって陽性となります

・ハムストリングスが肉離れしていた場合

・仙腸関節等、骨盤帯に問題がある場合

・股関節に問題がある場合

・神経自体に問題がある場合

「SLRが陽性だったって事は、安心できないな。ヘルニア以外の可能性も踏まえて評価を進めないと・・・」

逆に、「SLRが陰性だったという事は、ヘルニアの可能性は低そうだな・・・」と私は考えます。

結果が陽性であれ陰性であれ、結局は他にも検査を実施していく事になります

しかし、「腰椎椎間板ヘルニアの可能性が低い」という情報が得られるのは、陰性だった場合です。

SLRが陽性であったところで、確かな情報が得られたとは言えません。

上記を踏まえた最初の問いに対する答えは、「患者にSLRを実施し、陰性だった方が臨床的に意義がある」となります。

もう少し、詳しく説明すると以下のように説明できます。

感度の高い検査を実施して陰性だった場合、その病気を除外診断(Rule out:R/O)する事ができる

最悪覚えてしまえばよいのですが、ただ覚えようとしても忘れてしまいます。情けない事に、先日私はガッツリ間違えました苦笑

本来は、ここまで説明した様な感度・特異度に関する理解があれば勘違いする事はありません。

しかし、人間というものは狡賢い生き物なのです笑

実は、感度・特異度に関する便利な語呂合わせがあります。

決して語呂合わせに頼らず、背景にある感度・特異度の考え方を大事にしたいところですが、私は頭が混乱したらこの語呂合わせを頭に浮かべてから詳しい理論背景を思い出しています。


診断検査による確定診断

ここまで例に挙げたSLRは、感度の高い診断検査法です。では、今後は反対に特異度の高い診断検査法について考えてみましょう。

腰椎椎間板ヘルニアに関する診断検査にCrossed-SLRと呼ばれる検査法があります。

Michael Janka, et al. Clinical examination of the lumbar spine. MMW Fortschr Med.2019 Jan;161(1):55-58.より

SLRは挙上させた下肢に痛みや痺れが生じた場合に陽性と判断しますが、Crossed-SLRは挙上させた下肢と反対側に症状が誘発された場合に陽性と判断します。

Crossed-SLRの感度を20%・特異度を90%と仮定してみましょう。

※SLRと同様にCrossed-SLRの感度・特異度に関しては、問題の為に仮想の数値を設定しています。

では、先ほどのように腰椎椎間板ヘルニアの人100名・健康な人100名を集めて検査をしてみましょう。

結果は以下のようになるはずです。

詳しい説明は割愛しますが、SLRと逆に考えを進めていきましょう。

今度は、実際にはヘルニアである患者を間違って陰性としてしまう(偽陰性)の確率が80%と高く

逆に、実際にはヘルニアの無い健常人を間違って陽性としてしまう(偽陽性)の確率は10%と低い事に目がいくはずです。

つまり、以下のように考える事ができます。

特異度の高い検査を実施して陽性だった場合、その病気を確定診断(Rule in)する事ができる


こちらに関しても、便利な語呂合わせがありますので御紹介させてもらいます。

あくまでも、理論背景を踏まえた上で御活用下さい笑


感度・特異度の限界

ここまでの内容で感度・特異度に関して理解を深める事ができたかと思います。

では、極端な話「感度99%・特異度99%の検査法」があれば問題はないのでしょうか?

実は、感度・特異度を考える上で考慮しなくてはいけない大事な要因があります。

それは、有病率(prevalence)です。

有病率とは、検査を実施した時点において集団の中で病気にかかっている人の割合の事です。

ここまで腰椎椎間板ヘルニアについて考えてきましたが、そこではヘルニアの人、健康な人をそれぞれ100人ずつ集めた状態を仮定していました。

全200名のうち、半分の100名が腰椎椎間板ヘルニアなので有病率は50%となります。

2×2の表にしてみると、上のような状態になるはずです。ここで、陽性的中度・陰性的中度という言葉が出てきました。

陽性的中度(positive predictive value:PPV)とは、検査で陽性となった場合において実際に病気である人の割合です。

陰性的中度(negative predictive value:NPV)とは、検査で陰性となった場合において実際に病気でない人の割合です。

陽性的中度は、検査が陽性の際の「病気である割合」を表しています。この「病気である割合」の事を言い換えると「リスク」という事もあります。

病気に対する治療に関する分野ではリスクという言葉が使われますが、今回は診断検査に関わる分野なので陽性的中度という言葉が使われています。

この辺りを頭の片隅に覚えておくと、リスク差・リスク比といった用語を聞いても混乱せずに済むかと思います。



今回は、陽性的中度・陰性的中度ともに99%なので、やはり感度・特異度の高い検査法は優秀だと考えられます。

しかし、これは有病率50%という状況の場合です。実際に「2人に1人が腰椎椎間板ヘルニア」なんていう状況があるでしょうか?

全人類がヘルニアかどうかを調べて真の有病率を明らかにする事は出来ませんが、厚生労働省の腰椎椎間板ヘルニアのガイドラインで参考にされていた米国の論文では、人口の1%が腰椎椎間板ヘルニアに罹患していたと報告されています。

【厚生労働省(旧版)腰椎椎間板ヘルニアガイドライン 改訂第2版 https://minds.jcqhc.or.jp/n/med/4/med0017/G0000309/0001】

これを参考に、次は有病率1%だと仮定して1万人に対して感度・特異度99%の検査を実施してみましょう。

検査の結果は以下のようになるはずです。

どうでしょう?先ほどのケースと比較してみると、陽性的中度が50%と低くなる事に驚く人も多いのではないでしょうか?

このように有病率が低い場合は、感度・特異度が高くても陽性的中度は低くなってしまいます

一方で、有病率が低い場合は、陰性的中度は高くなります

逆に、有病率が高い場合は陽性的中度は高くなり、陰性的中度が低くなっていきます。

ただ有病率の高い疾患の検査を行うという状況は、あまり一般的ではないかもしれません。

少し前まで、新型コロナウイルスに対するPCR検査の是非が盛んに議論されており、その中でも、感度・特異度・的中度といった言葉が出てきました。

しかし、そもそも新型コロナウイルスの有病率が低い状況(感染拡大の初期)では、どんな検査法でも陽性的中度が低くなってしまうという事が理解できていれば、様々な検査法に関する議論に対して冷静に考える事ができたはずです。

陽性的中度・陰性的中度は有病率に左右されるという事を頭に入れておきましょう。


感度・特異度を上手に使う

基本的に感度・特異度の両方に優れた検査法は少なく、例え優れた検査法があったとしても何かしらネックとなる部分が存在します。

例えば、膝の前十字靭帯損傷に対するMRI検査は感度・特異度ともに優れた検査法ですが、簡単に実施できる検査法ではありません。

・MRIを有する医療機関が身近にあるのか?

・予約なしで早急に実施できるのか?

・閉所恐怖症の人は耐えられない場合がある

・金属を身につけていると実施できない場合がある

・費用の問題

上記以外にも様々な制約が考えられます。特に、スポーツ現場で早急に実施出来ない。という点は大きなポイントだと思います。

逆に、簡便に実施できる検査法になると感度・特異度に偏りが生じてくる事が多いです。

その時に、今回説明してきた感度の高い検査法による除外診断(SnNout)特異度の高い検査法による確定診断(SpPin)という考え方が大事になってきます。

ひとつひとつの検査法が持つ特徴を理解した上で、検査結果の意味を読み解く必要があります。

また、感度・特異度に優れた検査法でも有病率が低くなると陽性的中度が低下してしまいますが、これは「単独の検査だけで診断を下す事はできない」と言い換える事が出来ます。

恐らく、臨床やスポーツ現場でも「訳も分からず検査を実施する」人はいないはずです。

この「訳の分からない状態」とは、そもそも有病率が低い状態ともいえます。

そこから、検査に限らす様々な要因を踏まえる事で、「この患者は、この怪我(病気)の可能性が高いな」と有病率が高い状態に持っていく事が出来れば、感度・特異度の持つ臨床的な意義も高まっていきます。

私がスポーツ現場でアスリートのアクシデント(スポーツ外傷)に対して評価を実施する際、いきなり特殊な検査法を実施する事はありえません

・受傷機転(アクシデントの発生した状況)から得られる情報

・本人から問診で得られる情報

・視診や触診から得られる情報

・実際に身体を動かす事で得られる情報

他にも様々な情報を参考にしながら、「もしかしたら、こうゆう怪我をしたのかもしれないな」と予想を立てます。

このように、何も考えていない状態から有病率を高めた上で検査を実施していく事で、検査結果の意義を高める事が出来ます

検査と診断の違いを理解する

MRIのように医師・歯科医・診療放射線技師といった国家資格がないと実施できな検査法もあれば、今回紹介したSLR・Crossed-SLRのように、検査を実施するだけなら誰でも実施できる検査法は沢山あります。

私は、理学療法士・アスレティックトレーナーとして、患者やアスリートに様々な検査を実施してきました。

しかし、その結果を元に「あなたは~という病気です」「あなたは~という怪我です」というような診断を下す事は出来ません。

また、診断を下したように相手に受け取られない様に、説明には常に注意しなくてはいけません

患者に対し診断を下す行為は医業であり、少なくとも自身の保有している資格(理学療法士・JSPO-AT・CSCS・修士号)は、どれも診断を下せる資格ではありません。

様々な検査法を実施するのは、あくまで検査結果をもとに患者・アスリートの状態を評価する為です。

スポーツ現場でアクシデントが生じた時、アスリートに病院受診を促すために「~という検査を実施した結果○○の可能性が考えられます」という説明をする事があります。

しかし、必ず「検査から考えられるのは、あくまで可能性の話」「大谷は医師ではない事」「正しい診断の為には医療機関を受診する事が必用」だと十分に説明します。

・筋力や関節の可動域といった身体機能の評価

・疾患に対する診断

この線引きを疎かにした説明をしてしまうと、選手が医療機関をスムーズに受診できなくなってしまうばかりか、トラブルを生じる恐れもあるので、注意が必要だと私は考えています。


今回の投稿は以下の書籍を参考にさせて頂きました。統計に関わる内容を丁寧にまとめて下さっているので、興味がある方は是非ご覧ください。




さいごに

今回は、診断検査における感度・特異度・的中度といった項目について説明していきました。

文中におけるSLR・Crossed-SLRの感度・特異度は、ある程度先行研究を参考にしましたが、今回説明しやすいように数値を適当に私が調整していますので、アテにしないようお願いします。

感度・特異度に興味を持った方は、是非とも自分で色々文献を漁ってみて下さい。

ちなみに、実際は診断検査に関わる指数は他にも存在しますが苦笑

また落ち着いた時間が取れれば、まとめてみようと思います。

Googleアドセンス

大谷 遼

東京都生まれ福井県育ち。中学から陸上競技を続け、スポーツに関わる理学療法士となる為に大学に進学し、卒業後は佐賀県の整形外科医院に勤務。 約12年間、理学療法士として医療に関わるとともに、スポーツ現場でアスレティックトレーナーとして活動してきた。 /理学療法士/修士号(医科学)/日本スポーツ協会公認アスレティックトレーナー/Certified Strength and Conditioning Specialist:CSCS

RSS登録(Feedly)

記事のフォローはこちら↓↓↓

-統計, 診断検査