過去の投稿に画像リンク切れ多数ありご迷惑おかけしています.

新型SERSの流行をJMPでみる

JMP統計学

ドラッグストアでマスクが売り切れたりして,世間も騒がしくなってきました.今でもマスコミでは新型肺炎などと呼んでいますが,原因不明の段階ならばともかく,ウイルスが特定された現在は,新型コロナウイルス(因みに正式名称は2019-nCoV)による重症急性呼吸器症候群(Severe acute respiratory syndrome)いわゆるSARSと呼ぶべきでしょうか.特に感染症の場合,病名は重要だと思います.それによって一般人の知識が集積しやすくなるからです.ノロウイルスがいい例ですね.今回の感染症も,新型肺炎などではなくSARSの再来と捉えるべきで,区別する必要があるならば前回のはSERS2003で今回のをSERS2019とでもすべきです.今回のはSERS2003より致死率は低いようだなどと使えば,この先新たなSERSが流行しても過去の経験や知見が蓄えられていきやすいと思うのです.

それにしても,最近の新聞というのは不勉強というか不正確というかその両方なんでしょうけれど,例えば日本経済新聞のこの記事『新型肺炎、どれくらい怖い? 感染力はSARS並み』なんかタイトルからしてダメダメですね.読者の不安を煽るようなタイトルは週刊誌に任せるべきです.記事の内容も不勉強です.例えば,基本再生産数を2003SERSと比較していますが,これを読むと勘違いする人が多く出るのではないでしょうか.これはWHOの情報そのままなので,間違いではないですが,ちゃんと解釈して報道してもらいたいものです.具体的には,基本再生産数の説明として「感染者一人からうつる人数」とあって,これはもちろん正しいのですが,不正確です.少なくとも非専門家にはあたかも基本再生産数がウィルス固有の特性値のように読めてしまうからです.

基本再生産数とは,正しくは感染症の数理モデルであるSIR(Susceptible Infection Recovered)モデルの平衡状態の解の係数(マルサス係数)から導出される値です.このブログでは数式は書きにくいので言葉でSIRモデルを説明すると,感染症による三つの状態である,未感染者(感受性保持者),感染者,隔離者(回復者,死亡者)の間の過渡現象を三つの常微分方程式によって定式化したものです.私は,ケルマック-マッケンドリック伝染病モデルと習いましたが,最近ではSIRモデルと呼ばれることが多いようです.SIRモデルでは係数βで感染率,係数γで隔離率(回復した場合も含む)を定義します.細かい導出はさておいて,平衡状態でこの方程式を解くと,exp((β-γ)t)という指数関数になります.時間が経つと感染者数が指数関数的に増加するというマルサス法則がこれです.この(β-γ)の正負で感染者数の増減がドラスティックに変わることがわかりますが,この閾値をβ/γで定義したものが基本再生産数なのです.因みに,英語ではbasic reproduction numberと言い,以下では単にRと書きます.

感染率βは感染症の性質で決まるだけでなく,手洗いやうがいマスクの着用などの一般的な対策にも依存しますし,隔離率γは文字通り強制隔離のような対策をどこまで厳格にするかということに依存します.あるいは致死率が非常に高くなったりしても値は変わります.ワクチン開発に成功すれば,感染率βと隔離率γの両方に影響します.いぜれにせよ,これらの要素を全てひっくるめた係数がRなのです.MERSはその高い致死率故にRが1程度と流行の閾値にあったためにパンデミックには至りませんでしたが,未だ終息していません.

先ほどの日経新聞の記事には今回のSERSのRは1.4-2.5となっています.まだデータが少ない段階ですから,最初に置く仮定の違いによってRに幅が出てくるのだと思います.マスクが売り切れるなど,基本的に神経質で清潔好きな日本人ですから,閉鎖領域の日本ではRは小さくなると考えるのが妥当です.Rは日本と中国とでは異なることは十分に考えられます.十分なデータが積まれれば,年齢別や性別なども含めてRが推定できます.モンテカルロ法を使ったりした手法が提唱されていますが,最も単純には感染者数の回帰モデルを作成することでも大体の様子はわかります.

ということでJMPで3分分析をしてみます.以下は本当に簡単な分析なので,あまり信用しないでください,データは,中华人民共和国国家卫生健康委员会のWEBサイトから引っ張ってきました.新型冠状病毒感染的肺炎疫情最新情况にある感染者数をデータテーブルに書き込みます.データマニアの私は,実はこのデータは1/27に取得済みでしたので,まずこのデータを「二変量の関係」で「その他のあてはめ」からYを自然対数で変換します.その結果がこちらです.

感染症は数理モデルの威力がわかるいい例ですね.「時間」は記録がある1/20を1として一日単位で示しています.これだけではRは決定できませんが,マルサス係数が0.39となります.このモデルの予測値と1/28以降本日までの実測値とを突き合わせてみた結果が冒頭のグラフです.中国当局の情報隠蔽なども疑われてますから,はっきりとしたことは言えませんが,当初よりも流行は衰えてきていると言って良さそうです.巨大な隔離病棟を短時間に設置したり,大規模な地域立ち入り制限を発令したり,中国らしい大胆な対策が功を奏したと見るべきでしょうか.そうであれば嬉しいですね.1/28以降のデータのみでモデリングするとマルサス係数は0.2程度で,この値が0に近づき負に転じれば流行は収束します.

このように,Rは時間tに依存する関数なのです.環境の文化レベルや交通環境,その他もロモロにも依存します.このような基本再生産数の実態を知らせずして,一人当たり何人にうつるかというキャッチーな情報のみを取り上げる.これは日経新聞だけのことではありません.昨今の新聞には,やおら読者の危機感を煽るだけで,ポイントの外れた情報しか書かれていないことが目につきます.

手元にある二点(1/27と2/1)のRだけで予測しても何の意味もありませんが,このペースで行くとあと一週間で0になります...が,対策も手を尽くした段階でしょうから当面はRは正のままだと思います.それに帰国者565人のうち少なくとも8人が陽性だということは,母比率の推定をすれば,確かに本当の感染者は10万人弱というの数字が出てきます.とにかく,当面は手洗い,うがい,時差通勤で人混みを避けるなどのできる対策で基本再生産数を下げていきませんか.因みにマスクは3μmのフィルタのN95でもコロナウィルスには大きすぎるのですが,自分の鼻を知らずに触ってしまったりするのを防げるので,私は花粉症用のマスクを着用してます.

それではまた.

P.S.
このブログを書き終わってからこんな記事を読みました.西浦先生は確か一昨年かその前の年かのSUMMITで招待講演してくださったのを覚えています.西浦先生の推定でも感染者数は10万人を超えているとのこと.これはむしろ安心材料かもしれませんよ.皆さん怖いのは致死率だったりするので,報道されているよりも致死率は低いのかもしれません.

統計的問題解決研究所

コメント