前回も同じテーマでエントリーを起こした。しかし、発症日ベースに人数を変換できず中途半端な結論になってしまった。
昨日、@ma_pressさんのすばらしいグラフを拝見して、もうちょっとがんばってみようと再トライした。ご指導をいただいたわけでなく、勝手に私が感銘を受けて猿マネをしているだけなので、以下の記述の一切の責任は私にある。
人流によるリアルタイムRt推定&SIRモデルによる感染者数予測(全国版)。平日はRt~1.2、週末はRt~1.8。これまでのところ感染者数はモデル通りに推移。人流が今のまま推移した場合、来週の4連休明けには新規感染者1000人/日、お盆明けには1万人/日。8月末にはコロナ対応の病床が全国的に枯渇の見込み。 pic.twitter.com/PfQjd7oXtN
— ma_press (@ma_press) 2020年7月18日
感染報告日と発症日のデータは全く公開されていないのかと想っていたら、ジャグジャパンさんのcsvデータから東京以外で両方が分かるのデータが拾えることを教えていただいた。発症日と報告日の日数間隔を集計し、グラフ化してみた。
@Calico_Kater さんのツイットを拝見して発症日と感染報告日は、ガンマ分布するのだと理解した。発症が生じて、報告日までのある意味で待ち行列なのでガンマ分布なのだと理解すればよいのか?
潜伏期間の分布、発症間隔時間の分布と東京都以外の発症から確定報告までの遅れ時間の分布(完全ではない)から最終的な遅れ時間からガンマ分布shape(α)=8.036, rate(1/β)=0.47を算出して過去時間に引き伸ばして足し上げただけで、東京都のデータに東京以外のデータを使っていますかふらあやふやですよ
— 三毛猫🐈 (@Calico_Kater) 2020年7月17日
確率論および統計学において、ガンマ分布 (ガンマぶんぷ、英: gamma distribution) は連続確率分布の一種である。その性質は形状母数 k、尺度母数 θ の2つの母数で特徴づけられる。主に信頼性工学における電子部品の寿命分布や通信工学におけるトラフィックの待ち時間分布に応用される。また所得分布にも応用される。
ガンマ分布 - Wikipedia
これにより近似といえるレベルではないが、実データの間隔日数とガンマ分布をフィットさせることができた。
笑われてしまうレベルですが、ガンマ分布勉強しています。https://t.co/eMxUHhoMxH pic.twitter.com/wfrK2Dmema
— ひでき (@hidekih) 2020年7月18日
さらに、これを発症推定日から報告日ベースのPCR陽性者数に逆にかけることで陽性者の感染日を推定した。報告日ベースの陽性者(棒グラフ)と発症日ベースの推測数(折れ線)の比較のグラフを作った。
https://docs.google.com/spreadsheets/d/17WX_aFKVSCNQrHjwWN6LDT7ID_WkLT0FvIP2TeeoFQk/edit?usp=sharing
これらの下準備により、これらデータを使ってGoogle Mobility Reportの全国版と発症日ベースの陽性者数との比較グラフを作った。
@ma_press さんの劣化版に過ぎませんが、発症日ベースのRtとGoogle Mobility Reportの相関を示すグラフを全国版で作りました。
— ひでき (@hidekih) 2020年7月18日
発症者の推定を26日先まで発症ー報告日間隔のガンマ分布で行っているので、2月半ばから6月後半までの範囲のグラフです。https://t.co/0gvwQa5xxi pic.twitter.com/fNV6GXrpU4
MobilityとRtとの相関はかなり高い。まだt検定はしていない。
対象期間 | 相関係数 |
2/15-6/18 | 0.81 |
5/1 - 6/18 | 0.87 |
時系列としてではなく、MobilityとRtとの散布図を作り相関を取った。実データから最大26日程度の発症ー報告日間隔なので、フィットできたのは6月半ばまでのデータ。当然、ほかにも季節要因や、後に述べる空港検疫、報道などほかの要因がRtには影響しているはず。しかし、これらの結果から移動量はかなり説明力が高いとは言える。
移動量を基準日を1として比を取り、これを自乗した数値とRtとの散布図を作りました。Rt=2.39x - .768を相関係数.736で得たので、この式による推定Rtと発症日ベースのRtとの比較グラフを描きました。割とフィットしています。あ、すべての移動は「Transit」です。 pic.twitter.com/5agryheZz4
— ひでき (@hidekih) 2020年7月19日
グラフを再掲しておく。
この近似式、Rt=2.39 x Mobility - .768、によりRtをMobilityから推測できるようになった。更に一ヶ月先までの当日新規感染者の推測を行った。ma_pressさんの推測と比べるとかなり確度は低い可能性が高いが、何もしなければ8月半ばまでに全国で一日千人の陽性者がでる可能性がある。これには検査数の変動を考慮していない。検査数と陽性者数の関連性は今後考察したい。更に、単純なSIRモデル等から指数関数的に陽性者が増えていく場合の予想線も入れた。実は、ゴンペルツ曲線による推測もトライしているのだが、前提がどんどん変わっているようで、フィットしない。しかし、この指数関数的増加にはならないように推測される。
劣化の劣化にすぎませんが、10%移動量と感染率(1接触当)の積が下がればと言った根拠です。左のグラフがこのまま推移の場合。青線は報告日陽性者の指数関数近似R^2=.9でこのまま推移した場合。右のグラフは移動量と感染率の積を現状から10%減らしてRt≒1にできた場合です。https://t.co/0gvwQa5xxi pic.twitter.com/CCOrXWQSea
— ひでき (@hidekih) 2020年7月19日
更に、現在2月と比べると-20%から-25%程度で推移しているMobilityを-30%から-35%に減速させるか、Mobilityと1回の接触当たりの感染確率の積を-10%できればRt=1前後になると推測される。
なお、私はまだ空港検疫のデータにまでたどり着けていないのだが、@Calico_Katerさんの「気持ち悪さ」は共有しておきたい。3月の感染拡大と空港検疫の感染者見逃しは確実に関係していた。
空港検疫の陽性率の変化が国内の感染状況のRtに応答しているように見えてほんとう気持ち悪い😳たまたま曜日占いについていったわけじゃないと思うぞ😳 pic.twitter.com/wGrZ4bZPaJ
— 三毛猫🐈 (@Calico_Kater) 2020年7月16日
https://hpo.hatenablog.com/entry/2020/06/16/222911
さらに、今後、ドイツ、イスラエル、スウェーデンの状況はよくよく注視したい。経済再開、移動量と感染の制御のお手本になるのではないかと期待している。これもまだ調査中なので私の当て推量であることは注記しておく。
いまの状況から考えるに、新型コロナウイルスは日本にといて根絶はかなり難しいと考える。ウィズコロナ、アンダーコロナでどう経済再開を果たすのか?中国のように発祥国でありながら、すでに感染制御をし、なおかつ戦狼外交と言われる東西南北に対抗しつづけ、領土拡大を模索する政策を取り続けている国との関係性も新型コロナウイルスは影響してくる。今年4月の@HironoriFunabi1さんの一連ツイートは今も有効であると考える。
新型コロナウイルスに対するワクチンや治療薬が、もし開発できないとしたら?
— Hironori Funabiki (@HironoriFunabi1) 2020年4月16日
集団免疫(herd immunity)をキーワードとして、国家が対処する極端な二つの戦略を考えてみる。
副読書として、ジャレド・ダイアモンド『銃・病原菌・鉄』とオースン・スコット・カードのSF『死者の代弁者』を薦めたい。1/
私の見聞きする周辺の経済で言えば、あと1月現状が続けば倒産だの、店を閉じるだのの続発となるだろう。希望を失えば、借入をする気にもなれない。金融機関ですら、不良債権の嵐となる。命と命のがちな重さ比べの意思決定が政権にかかってくるのだろうか。
— ひでき (@hidekih) 2020年4月21日
新型コロナウイルスによる被害の比較はほかにエントリーを起こしているのでここでは繰り返さない。
以前(6月)にも、他の方が作った同じようなChartが回覧されて来ておかしかったので、当方で作り直しましたね。最新化しておきました。
— INOUE Takashi/井上貴史 (@takainou_0907) 2020年7月19日
COVID-19死者数と世界の死因(年間死者数を日割計算)ランキング https://t.co/PyIHZAMdtt
COVID-19死者数は、結核とHIV/AIDSの間
■追記
三毛猫(@Calico_Kater)さんのご指導で、エントリー、スプレッドシートの中で感染日と発症日が混乱していたので、4日程度ガンマ分布のピークを後ろに送り発症日ベースにただした。詳しくはエントリーをあとで修正する。とりあえずのグラフはこちら。
えっと、なんとエントリーに書いたのとほぼ同じ相関係数でました。4日程度感染ー発症日分づらしたつもりです。なんででしょう?
— ひでき (@hidekih) 2020年7月20日
RtとMobility 2/15-6/18 相関0.83
RtとRt推定値 2/17-6/18 相関0.82 pic.twitter.com/uO5I4GolV0