過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

検査の損益に付いて考える

JMPではじめるデータサイエンス統計学

先々週のブログで,PCR検査は検査というよりも,仮説検定と同じテストであるとみなすべきと書きました.もちろん,同じテストだと言っても,確率に基づいた判定ではないという点では,仮説検定とは厳密には違います.ではありますが,試行の結果(イベント)を真実と判断結果の四分割表に割り当てる手法であると緩く考えるとPCR検査の実態をより深く理解することができます.4つの領域は「あたり」と「はずれ」が半々ですが,このうちの2つの「はずれ」が意思決定手法としての評価に特に重要です.仮説検定では,それらを第一種の過誤と第二種の過誤と呼ぶわけですが,この命名では両者の違いがわかりにくいと思いませんか.英語でも,それぞれType IエラーとType IIエラー,あるいはαリスクとβリスクと言うので,分かりにくいという点では同じです.

蛇足ですが,過誤はエラーを和訳したのだと思いますが,これは二つのあやまちの複合語です.どういう意味かと言うと,「誤ち」と「過ち」は共にあやまちですが,前者には早とちりの意味があります.高速道路の出口を誤って一つ手前で出てしまった,などと使います.一方,後者には見逃しの意味があります.あまり動詞としては使い分けないようですが,同じ例を出すと,高速道路の出口を過って降り損なった,ということになるでしょうか.第一種の過ちと書いてある参考書もありますが,厳密には間違いです.漢字を使うならば第一種の誤ちとすべきでしょうけれど,「あやまち」としておく方が無難かも知れませんね.少し脱線しました.

日本では,アルファのaを「あわてもの」ベータのbを「ぼんやり」と紐付ける強引な覚え方もありますが,やはり,偽陽性や偽陰性という医療系で使われる用語の方が概念が明確になります.技術分野であまり使われないのは,判断の対象が陰陽と紐付けにくいものが多いからでしょうか.例えば,ある文字を「1」なのか「I」なのかを機械学習で判別することを考えると,その判断の結果は良くも悪くもないニュートラルなので,陰陽という概念と関連付けるのは困難です.

PCR検査と仮説検定で使われる用語がそれぞれ異なるのは仕方ないとしても,両者のアナロジーをとる上で注意すべきことがあります.一つは,仮説検定では帰無仮説を棄却できなかった場合をPCR陰性と対応付ければ,仮説検定では対立仮説について何も言及しない(できない)のですが,PCR検査では陽性と判定されなければ陰性と判定されるという違いです.このことからも,PCR検査陰性の実態が理解できるのではないでしょうか.そもそも,いかなる検査でも100%陰性判定は下せないと考えるべきなのです.もう一つは,四分割表に記入される数値は,PCR検査では多数の被験者に対しての結果の割合であるのに対し,仮説検定では確率で記述することが多いということです.もちろん,両者は無限回の試行の元で一致しますが,多数回の検定を実施することはあまりないと思うので,割合と確率は違うものだということは,頭の片隅には置いておくと良いです.因みに,これが大数の法則の言わんとするところですね.

次に,四分割表のそれぞれの領域の実態を考察していきます.
a) 検査の結果陽性で,実際に感染していた.
真陽性の場合で,検査が最もわかりやすい形で役に立ったケースです.インフルエンザのようにロシュ社のタミフルなどの治療薬があれば,積極的検査で早期に陽性確定する意義は大きいです.タミフルでは発症後48時間以内に服用しなければ効果がないと言われています.但し,どんな薬にも副作用は付き物なので,自然治癒に任せた方が結果としてハッピーだったというケースは全くないとは断言できません.

b) 検査の結果は陽性だったけど,実際には感染していなかった.
偽陽性の場合は,本人にとっては大きな不利益を被ります.無症状者であればなおのことです.二週間安静を強いられるのはまだ良いとしても,退院後に感染済みで免疫ができていると油断する人もいるだろうという懸念はあります.それと日本文化特有の要因から,プライベート面でいろいろな問題が生じることもあるようです.お店や個人などが嫌がらせを受けたり,言われのない差別をされたり,これは現在進行形で起こっていることです.いわゆる藪蛇とも違うのかもしれませんが,必要のない検査なら受けない方がハッピーだったということです.

c) 検査陰性で実際に感染していなかった.
真陰性の場合です.検査の結果が陰性ならば,発症していれば,少しは安心できるかもしれませんんが,症状がなければ,少なくとも今日1日は安心できるというだけのメリットとも言えます.以前のブログでも書いたように,PCR検査の信頼性を知っていれば手放しで安心はできないはずです.仮説検定と同じく陽性でないないことが示されただけで,陰性であることが示されたわけではないのです.感染していても未発症なだけかもしれないし,明日感染するかもしれません.発症者であっても,高熱が続く他の疾病もたくさんあるので高リスク者でなければ,むしろ不安に思うかもしれません.

d) 検査陰性だけど実際には感染していた.
この偽陰性の場合が一番怖いですね.発症者であれば行動が制限されるはずですが,無症状者であれば確実に感染を拡大させてしまいます.もっとも,高熱でバス旅行に出かけた老人などもいらっしゃいましたけど.このケースは個人にとっても家族の感染や本人の治療開始の遅れなど大きな損害を受けますが,特に社会に大きな損害をもたらします.

上記考察から損益を数値で見積もります.因みに,非感染者が検査を受けることで感染する可能性や,感染者が検査を受けることで医療関係者に感染させてしまう可能性も考慮すべきですが,そこは今は考えていません.本来は,検査を受けるか否かの意思決定の下にPCR検査があるという二重構造を考えるべきです.法律学的に算定するのも面倒なので,それぞれのケースに平均的な個人の価値観を予想して,それをもとに利益と損を[a, b, c, d]の形式で書いてみます.それぞれのケースに値段をつけるというのも難しいところですが,いくらもらうなら(あるいは失うなら)釣り合うのかを考えてください.通常はこれらの損益を4×4行列で書き,これに混同行列をかけて期待利益を算出します.

多くの人がa)の場合の価値を大きく見積もっていると予想しますが,バランスも考慮して仮に[10000, -10000, 100, -100000]としてみます.単位は円です.(因みに,自分の価値観ではd)の損はもっと多くしますね.)1%の有病率のもとでのPCR検査では,感染者が未発症の場合の感度が20%程度とのことなので,10000人中100人の感染者に対し陰性判定されるのが80人ですね.それから,特異度は99%としておきます.(おそらくもっと大きいとは思いますが,後述するように期待利益には大きな影響は出ないので.)とすると,残りの9900人中99人が誤まって陽性と判定されてしまうことになります.これらから.混同行列を求めます.因みに,発症当日でも偽陰性は80%なので0%にはなりません.こういう実態がようやく明らかになってきたようで,ここに良い解説があります.

ということで,期待利益を冒頭の式から計算すると,端数を切り捨てると20-800+98-99=-781円になります.(この式では,利益と損益とが混ざってしまいましたが,修正するのも手間なのでご容赦ください.)になってしまいましたが,混同行列は有病率でも大きく変わりますし,上記では未発症者を対象としましたが,濃厚接触者で発症者であれば,更に大きく変わります.ですけれど,期待利益を計算するには些細な違いということがお分かりでしょうか.偽陰性率が決して0%にならないことを知れば,重要なのはむしろ個人の価値観です.仮に真陽性の利益を100000円とし,偽陽性の損を10000円と見積もると期待利益は119円になりますが,PCR検査の場合は個人の利益と社会の利益の双方を考えなければならないので状況は複雑です.基本は社会全体の期待利益を考えるべきです.そうなると,上述したように本来はPCR検査を受けることの損益も考慮した二重構造を考慮することになります.

このような考察を書いてみましたが,決してPCR検査をするなということではないです.それが必要なときに直ちに結果を出せる検査体制は,クラスター対策には必須の要ですから.但し,クラスターと無関係の人にまで検査をする場合は,このようなことはどんな教科書にも書いてある考察は必要だと考えています.身近な検査に対しても同様な考察をすることで,イベントの理解が深まります.

機械学習の分類判定の評価も勉強できますね.少し用語が違うので最初のうちは混乱するかも知れません.機械学習では感度は検出率(Recall)と呼ばれます.仮に「1」が正しい文字をどの程度「1」と分類できたかを示します.一方,紛らわしいのですが,「1」と分類した文字がどの程度本当に「1」だったのかを示すのが,精度(Precision)です.分類器の検査性能を精度で定義することもありますが,実務的には,検出率と精度の調和平均であるF値で分類器の性能とする場合が多いようです.調和平均なので二つの指標のバランスを重視していることになります.そういえばF値も色々な言葉で言われている言葉です.統一してもらえるとありがたいのですが.

本日もお付き合い下さりありがとうございました.時間となりましたので,それではまた.

統計的問題解決研究所

コメント