待ちに待った発表があった。結果はかなり予想外ではあったが。
厚生労働省は、今月1日から7日にかけて人口が一定規模ある地域のうち、10万人当たりの感染者数が最も多い東京と大阪、最も少ない宮城の3都府県で、無作為抽出した20歳以上の男女合わせて7950人を対象に、新型コロナウイルスの抗体検査を実施しました。
その結果、抗体を保有している人の割合は、東京で0.1%、大阪で0.17%、宮城で0.03%だったと16日発表しました。
海外企業のロシュ社とアボット社が製造する2種類の試薬を使った検査で、いずれも陽性となった場合に「陽性」=「抗体を保有している」としました。
https://www3.nhk.or.jp/news/html/20200616/k10012471891000.html
抗体検査についての統計的側面を中心にしたエントリーをあげたのが、4月23日なのでかれこれこの結果を二ヶ月待っていたことになる。
陽性認定の条件が厳しかったのかも知れない。偽陽性を避けるには仕方なかったのだろう。統計的には非常に保守的にデザインされたのだと考える。保守性を加味しても、欧米のような10%以上などの抗体陽性がでなかったことは、日本の新型コロナウィルス対策が結果的に極めて適切であったことが証明された。正直、私は顕在PCR等陽性者1.7万人の50倍から100倍程度は無症状の潜在感染経験者がいるものだと信じていた。
ということで、日本におけるR0が2.5であるという仮説の立証はますます難しくなったと考える。まずはデータの傾向を知るために新規感染者数とRtのグラフを見て、傾向をチェックした。最初に、以前のモデルを0.1%感染経験者という仮定で実データとフィットさせようとしたがどうやってもR0は2以上にはならない。Rtもほとんどの区間で2にはならない。しかも、時系列の先へ行くに従って誤差が大きくなる。1月の新型コロナウィルス上陸から半年近く経っても、この程度の抗体検査陽性、感染経験者数ということは、今回のエピデミックは少なくとも日本においては指数関数的な増加にはなっていない。こう断言する理由も最後で述べる。
https://docs.google.com/spreadsheets/d/1iChrRlyjpCbJAwwePabR9gIZBfPa-yFCNKrgdgQPYn0/edit?usp=sharing
以前、死亡者数とゴンペルツ曲線の近似を行った。かなりフィットしているので、感染者数もゴンペルツ曲線で近似しうると考えたが、PCR陽性者と潜在感染者の関係がわからなかったので、やらなかった。今回始めて統計的妥当性を持つ調査の結果が明らかになったので、総感染者数の近似を行うことにした。
中国株と欧州株との間で係数に大きな開きがあることは確実なので、屈曲点を仮定して報告美ベースで2月半ばから3月末までの感染者数と5月6日までの感染者数によってゴンペルツ曲線の係数の推定を行った。2月後半から3月末までと、4月1日から5月6日までのそれぞれのデータから係数の同定、推定を行い実データとの比較グラフを作った。当然だが5月初旬まではフィットするがその後は最大感染者数、Gmaxが2万人と過大に推測されたためにあまりフィットしていない。それでも、指数関数、SIR的なモデルの予想よりははるかにフィットしている。指数関数との違いは恣意的にRtあるいはRt=R0 x (1- p)のpを操作しなくとも、時系列の先に行っても実際のデータとの乖離が大きくはならない。
次に、4月1日前後に存在するであろう屈曲点を求めて、実データ当日と前日の累積感染者数、F(t)とF(t+1)、の縦軸対数グラフにおいて、一次方程式の近似で相関係数R^2が最大となる点を探した。報告日ベースで、3月22日と4月14日当たりでR^2が.99となり、屈曲点でないかと考えた。
まず、4月14日で分けた近似グラフ。黄色の破線は、4月14日から5月6日までのデータで係数を推測している。よくフィットしている。屈曲点の前と後のGmaxが4月14日以前のデータからだと51百万人と、以降のデータからで1.7万人。驚くほどの数字だ。3月の上昇がかなり厳しかったことがうかがえる。ただし、現在1.7万人を超えてしまっているので必ずしても未来予測には使えない。
次に、同じくR^2が最大.99となった3月22日で同様のことを行った。この時の予想Gmaxは同様に前半データで4,300人、後半データで19百万人。
この結果を受けて、屈曲点が2つ、同様の傾向を持つ区間が3つ存在すると考察を行った。
つまり、屈曲点は2つあって、日本の感染は3期に分かれると推測します。日付は推測発症日です。
— ひでき (@hidekih) 2020年6月16日
①武漢株が入り収束に向かった時期。〜3月初旬
②欧州株が入り急速に感染速度が上がった時期。〜3月末
③「鎖国」状態となり定常状態に向かった時期。〜現在
②から③への推移をどうみるかです。
この屈曲点をどう考えるか?
志村けんさんの死をきっかけに自然自粛モードになったか?だとすると、2月の休校のインパクトの方が大きかったと考えます。
— ひでき (@hidekih) 2020年6月16日
緊急事態宣言ではタイミングが合いません。
3月28日の検疫自衛隊出動から大きく変わったと私は見ております。あくまで素人の私見です。
欧州株感染者が大量に入国した3月半ばだけが外乱要因であったと考えるとよくつじつまがあう。
@ikedanob @ABOFAN
— ひでき (@hidekih) 2020年5月31日
ちゃんと水際対策で逃した数まで! pic.twitter.com/BP2Dy3eAhm
押谷先生のインタビュー記事はもう公開が終わってしまったので、画像を再度貼っておく。3月の入国者の感染者数のところは赤線を書き込みたいくらい。
ちなみに、ゴンペルツ曲線はかなり感染が進んだ後でないと信頼できる係数の算定が難しいという面があるらしい。
ありがとうございます。
— ひでき (@hidekih) 2020年6月16日
> N(tx)=186/e≒68人
今回のような最大感染者数が1.6万人とかになると、
1.6万 / e = 約5,886人とかになってしまいますか?
それとも、Rtだの指標を見ながらの判断でよいと想われますか? https://t.co/Ic94RNwdT9
データ分析ではグラフを書いて見ること大事ですよね。 pic.twitter.com/4z5oKoapc5
よく寝てからまた明日によくよく考える。 → 考えた結果。
朝、昨晩やり残したと想い、新規感染者数の実データ(三日移動平均)とゴンペルツ曲線からの予想データの相関と折れ線グラフ作った。感染者数減ると中野先生の論文で各国のK値でも「ズレ」が生じていたと記憶するがあまり合わない。https://t.co/Ic94RNwdT9 pic.twitter.com/YiavbgN6lk
— ひでき (@hidekih) 2020年6月16日
ゴンペルツ曲線はある程度の期間データを取らないと近似可能な係数の推定にブレがでるようだし、減衰していった先の方のデータでの一致は指数関数、単純なSIRモデルよりははるかに「まし」に私には見えてるが、それでもだらだらと続く区間については予測が難しいように見える。