HPO機密日誌

自己をならふといふは、自己をわするるなり。

厚労省大規模抗体検査結果の発表

待ちに待った発表があった。結果はかなり予想外ではあったが。

厚生労働省は、今月1日から7日にかけて人口が一定規模ある地域のうち、10万人当たりの感染者数が最も多い東京と大阪、最も少ない宮城の3都府県で、無作為抽出した20歳以上の男女合わせて7950人を対象に、新型コロナウイルスの抗体検査を実施しました。

その結果、抗体を保有している人の割合は、東京で0.1%、大阪で0.17%、宮城で0.03%だったと16日発表しました。

海外企業のロシュ社とアボット社が製造する2種類の試薬を使った検査で、いずれも陽性となった場合に「陽性」=「抗体を保有している」としました。

https://www3.nhk.or.jp/news/html/20200616/k10012471891000.html

抗体検査についての統計的側面を中心にしたエントリーをあげたのが、4月23日なのでかれこれこの結果を二ヶ月待っていたことになる。

hpo.hatenablog.com

陽性認定の条件が厳しかったのかも知れない。偽陽性を避けるには仕方なかったのだろう。統計的には非常に保守的にデザインされたのだと考える。保守性を加味しても、欧米のような10%以上などの抗体陽性がでなかったことは、日本の新型コロナウィルス対策が結果的に極めて適切であったことが証明された。正直、私は顕在PCR等陽性者1.7万人の50倍から100倍程度は無症状の潜在感染経験者がいるものだと信じていた。

hpo.hatenablog.com

ということで、日本におけるR0が2.5であるという仮説の立証はますます難しくなったと考える。まずはデータの傾向を知るために新規感染者数とRtのグラフを見て、傾向をチェックした。最初に、以前のモデルを0.1%感染経験者という仮定で実データとフィットさせようとしたがどうやってもR0は2以上にはならない。Rtもほとんどの区間で2にはならない。しかも、時系列の先へ行くに従って誤差が大きくなる。1月の新型コロナウィルス上陸から半年近く経っても、この程度の抗体検査陽性、感染経験者数ということは、今回のエピデミックは少なくとも日本においては指数関数的な増加にはなっていない。こう断言する理由も最後で述べる。

f:id:hihi01:20200616224225p:plain

https://docs.google.com/spreadsheets/d/1iChrRlyjpCbJAwwePabR9gIZBfPa-yFCNKrgdgQPYn0/edit?usp=sharing

以前、死亡者数とゴンペルツ曲線の近似を行った。かなりフィットしているので、感染者数もゴンペルツ曲線で近似しうると考えたが、PCR陽性者と潜在感染者の関係がわからなかったので、やらなかった。今回始めて統計的妥当性を持つ調査の結果が明らかになったので、総感染者数の近似を行うことにした。

hpo.hatenablog.com

中国株と欧州株との間で係数に大きな開きがあることは確実なので、屈曲点を仮定して報告美ベースで2月半ばから3月末までの感染者数と5月6日までの感染者数によってゴンペルツ曲線の係数の推定を行った。2月後半から3月末までと、4月1日から5月6日までのそれぞれのデータから係数の同定、推定を行い実データとの比較グラフを作った。当然だが5月初旬まではフィットするがその後は最大感染者数、Gmaxが2万人と過大に推測されたためにあまりフィットしていない。それでも、指数関数、SIR的なモデルの予想よりははるかにフィットしている。指数関数との違いは恣意的にRtあるいはRt=R0 x (1- p)のpを操作しなくとも、時系列の先に行っても実際のデータとの乖離が大きくはならない。

f:id:hihi01:20200616221811p:plain

次に、4月1日前後に存在するであろう屈曲点を求めて、実データ当日と前日の累積感染者数、F(t)とF(t+1)、の縦軸対数グラフにおいて、一次方程式の近似で相関係数R^2が最大となる点を探した。報告日ベースで、3月22日と4月14日当たりでR^2が.99となり、屈曲点でないかと考えた。

まず、4月14日で分けた近似グラフ。黄色の破線は、4月14日から5月6日までのデータで係数を推測している。よくフィットしている。屈曲点の前と後のGmaxが4月14日以前のデータからだと51百万人と、以降のデータからで1.7万人。驚くほどの数字だ。3月の上昇がかなり厳しかったことがうかがえる。ただし、現在1.7万人を超えてしまっているので必ずしても未来予測には使えない。

f:id:hihi01:20200616221440p:plain

次に、同じくR^2が最大.99となった3月22日で同様のことを行った。この時の予想Gmaxは同様に前半データで4,300人、後半データで19百万人。

f:id:hihi01:20200616222405p:plain

この結果を受けて、屈曲点が2つ、同様の傾向を持つ区間が3つ存在すると考察を行った。

この屈曲点をどう考えるか?

欧州株感染者が大量に入国した3月半ばだけが外乱要因であったと考えるとよくつじつまがあう。

押谷先生のインタビュー記事はもう公開が終わってしまったので、画像を再度貼っておく。3月の入国者の感染者数のところは赤線を書き込みたいくらい。

f:id:hihi01:20200617073900p:plain

ちなみに、ゴンペルツ曲線はかなり感染が進んだ後でないと信頼できる係数の算定が難しいという面があるらしい。

よく寝てからまた明日によくよく考える。 → 考えた結果。

ゴンペルツ曲線はある程度の期間データを取らないと近似可能な係数の推定にブレがでるようだし、減衰していった先の方のデータでの一致は指数関数、単純なSIRモデルよりははるかに「まし」に私には見えてるが、それでもだらだらと続く区間については予測が難しいように見える。