
リハビリテーションセンター
感度と特異度の視覚的理解
ある疾患が有るか無いか診断を確定させるために血液検査等で陽性と陰性を判定する場合があります。前稿では検査の「感度」と「特異度」、さらに「検査前確率」が重要であることを示しました。この稿は、それを視覚的に理解することを目的とします。
ある架空の疾患と検査を考えます。その検査では0~14までの連続数値として結果が出るものとします。図の横軸がその数値の大きさを示します。縦軸は、一定人数に対して検査を施行した時に、横軸で示す検査値になった人の数です。この検査では疾患群も健常群も正規分布するとします(図1)。
このような図では、それぞれの群の面積が、その群の総人数を示します。疾患群(赤実線)は平均値(μ)が9.0で、標準偏差(σ)が0.5の正規分布です。これは疾患群について検査を行った場合、多くの人が9.0前後の値を示すことを意味します。標準偏差が0.5というのは、9.0±0.5、すなわち8.5~9.5の間に68.3%の人が含まれるということです。山の形の分布の山頂は人数が一番多い数値の場所であり、そこが平均値です。標準偏差は山麓部の広がり具合を示します。この図のように尖った山では標準偏差が小さく、データが平均値の周りに密集します。疾患が無い健常者に同じ検査をした時は、平均値が5.0で標準偏差が0.5の正規分布(青実線)をするとします。
(参考)
μ±1σ 68.3%
μ±2σ 95.4%
μ±3σ 99.7%
検査値により、疾患で有ると言えるか(=陽性)、疾患で無いと言えるか(=陰性)を区別する基準が必要です。この値のことを「カットオフ値」と言います。図1の場合、陽性と陰性を区別するためのカットオフ値を設定することは容易です。この図ではカットオフ値を健常群(青山)と疾患群(赤山)の中間である7.0にすると、陽性と陰性を完全に区別できます。青山と赤山の検査結果に重複領域が無いからです。しかしながら、通常は、このように都合の良いことは生じません。どうしても検査値には重複する領域が出来てしまいます。
図2に健常群と疾患群で両者とも標準偏差が1.0の場合を示します。それぞれの平均値は図1と同じですが山の形が異なっています。標準偏差の2乗のことを「分散」と言います。これが大きいということは、山麓部が広がっていることを意味し「分散が大きい」と表現します。平均値が図1と同じであっても分散が異なると違った世界が生じます。この場合、青山と赤山は検査値7.0で交わります。数値が重複する範囲には疾患者と健常者が混在しています。この場合でも、陰性と陽性を決めるカットオフ値をどこかに決めなければいけません。図3のようにα、β、γの3つの値を考えてみます。
例として、値が一番低いαを考えてみます(図4)。疾患群(赤実線)のうち、αより大きな結果となった人(A)は、疾患があり、なおかつ検査も陽性という正しい結果ですから「真の陽性(A)」です。疾患群にはαより小さくなる人(B)も存在します。これらの人は、疾患が有るのに陰性と判定されてしまいます。間違った結果ですから「偽陰性(B)」です。疾患群の総数は(A+B)です。この検査の「感度」はA/(A+B)で示されます。この検査で正しく疾患を選び出すことができる確率のことです。αのようにカットオフ値が低い場合は「真の陽性者(A)」が多くなり、間違って陰性と判定してしまう「偽陰性(B)」は減ります。疾患群の総数は(A+B)と一定ですから、感度「A/(A+B)」は高くなります。αのようにカットオフ値を低くすると、疾患を見出す確率が大きくなり、疾患を見落とす確率が小さくなります。
一方、健常群(青実線)の中でも、αより大きな検査値となる人が存在します(C)。これらの人は「陽性」と判定されますが「健常群」です。これは間違った結果なので「偽陽性(C)」です。検査値がαより小さな人は陰性です(D)。この判定は正しいので「真の陰性(D)」です。特異度はD/(C+D)で示されます。健常群の数(D+C)は一定なので、αのようにカットオフ値を低くすると「真の陰性(D)」が減ります。従って特異度「(D/(D+C)」は低くなります。
以上をまとめると、αのようにカットオフ値を低くすると、感度が高くなり、疾患を見落とす確率は小さくなります。その一方で、特異度が低くなり、偽陽性が増えます。すなわち、疾患で無い人を疾患とみなしてしまいます。例えとしては適切とは言えませんが「誤認逮捕」が増えます。
図5のようにカットオフ値として高い方のγを採用すると、この逆になります。すなわち感度が小さくなり、特異度が大きくなります。同じ例えで言うと、誤認逮捕は減りますが、真犯人を見落とすことが多くなります。以上より、感度と特異度はトレードオフ(二律背反)である仕組みが分かると思います。これらの長所・短所を考えると、カットオフ値としては、その中間にあるβを採用するのが無難と言うことでしょう(図3参照)。
前稿で示したように陽性適中率はA/(A+C)で、陰性適中率はD/(B+D)です。同じ「感度と特異度」の検査であっても、「検査前確率」を大きくすることで陽性適中率を高くできることを前稿で示しました。この事を視覚的に示します。検査前確率を3段階で設定してみます。理解の助けとなるように前稿の設問の数値を当てはめてみますが、次に示していく図では必ずしも面積と数値は比例しません。変化していく過程を理解できればと思います。検査は感度90%、特異度80%です。便宜上、カットオフ値を7.2とします。3つの場合とも、健常群と疾患群の合計人数は10,000人です。検査前確率が高くなるということは、この10,000人のうち疾患の人の割合が増えるということです。このことで「真の陽性者」が増えて陽性適中率が大きくなります。
(1) 検査前確率が0.1%の場合(図6)
健常群9,990人
疾患群10人
(2) 検査前確率が5%の場合(図7)
健常群9,500人
疾患群500人
(3) 検査前確率が20%の場合(図8)
健常群8,000人
疾患群2,000人