HPO機密日誌

自己をならふといふは、自己をわするるなり。

K値の線形的わかりやすさとデータに対する謙虚さ(個人的メモ)

どうしても指数関数的、折り込み的な増加は一般に理解しがたい。いや、私も文系素人なので人のことは全く言えないのだが、今回の新型コロナウィルスのような場合はこの違いが顕著になる。

正直、当初、K値について聞いた時はなんと単純な指標だろうと。これでは指数増加と矛盾しないか?、それでもなくても複雑な状況で新しい指標でなにをと理解に苦しんだ。自分のツイートを検索すると最初にK値に触れたツイートが出てきた。5月9日付だった。自分の不明を恥じたい。ちなみに、この二つの山のグラフがとても重要だと最近理解した。あとで説明する。

大阪大学核物理研究センター長の中野貴志教授は、1から「1週間前の総感染者数を当日の総感染者数で割った値」を引く数式(K値)を提案しています。この数式では感染が収束すると0になります。Our World in Dataのデータをもとにシンガポールの感染状況をグラフにしてみました。

f:id:hihi01:20200527124117p:plain

シンガポールとよく似た日本の状況)
f:id:hihi01:20200527130627p:plain

中野先生の「ノート」にK値が定義されていた。

f:id:hihi01:20200527124912p:plain

http://www.rcnp.osaka-u.ac.jp/~nakano/note1.pdf

これは、

𝐾 = 1 − 1週間前の総感染者数(D1) / 当日の総感染者数(D7)
 = D7 / D7 - D1/D7= (D7 - D1) / D7

となり、「過去1週間の新規感染者の合計を当日の感染者数で割った比率」となる。この時、ちょうどRt値について考えていて、更には教えを請うていたので、なるほどとは想った。

以前から2月6日以降の厚労省のデータを自分のスプレッドシートで計算していた。しかし、Rtの計算方法がいまいちぴんとこなかった。そこでフィナンシャルタイムスに載っていた倍加日数に注目した。倍加日数を計算するのは、一定期間の「増加率」から計算する。K値は7日だが、私は10日と5日で計算した。K値は「感染者の増加傾向の減少」を対象にしているので1から0の値にしているのに、対し私は倍加日数計算のために一日当たりの増加率を計算していた。以下の式のD2、D12はそれぞれ10日前、当日の感染者総数を意味する。

増加率 = round(D12/D2,4)
1日当増加率 = power(D12/D2,1/10)
倍加日数 = log(2,一日当増加率)

https://twitter.com/hidekih/status/1262617935916396545

ちなみに、

K =1- D1 / D7
K -1 = - D1 / D7
1-K = D1 / D7
1 / (1-K) = D7 / D1 = 増加率

となる。

実際は、7日間なり、10日間の増加率のべき乗によってKが求められることになるのだが、言わば増加率の逆数となる。更に、「単利」で計算しているここと同じ。ここがK値の線形性のわかりやすさかなと。増加はしていても、増加速度は落ちている。日毎のK値を計算しているので、言わば移動平均をしている。K値が一貫して減少してるグラフは、全体から言えば弓形になる。例えば、米国の総感染者(正確には現感染者)のカーブのイメージ。

f:id:hihi01:20200527141415p:plain

https://www.worldometers.info/coronavirus/country/us/

これが中野先生の大発見(少なくとも私にとっては!)につながる。

f:id:hihi01:20200527133344p:plain
値が大きく変化する領域では、~0.04/day の変化率で K の値が線形に減少している。K の変化が線形からずれる 2 月 26 日で K 値は 0.005 である。これは前週(2 月 19 日)と比べて、総感染者数が 5%増加したことを示す。4 月 14 日の段階で中国の K 値はさらに一桁小さくなっている。

ここで計算されたK値が線形に減少している!これを各国に当てはめられ、一貫していることを発見された。

その上で、中野先生は最初に示した言わば「N」字型、減少傾向が一次上昇し、更に減少傾向になっている日本のK値の謎を解く。

f:id:hihi01:20200527133542p:plain
総感染者数を3月25日でリセットした結果、日本でもK値がほぼ線形に単調減少している。最後の7点を直線で外挿すると感染収束予想日として5月5日が得られる。(リセット日を3月27日にすると予想日は5月2日になる。)また、収束以前でもK値が予想できれば、その値の変化に基づいて、新規感染者数の推定も可能である。

ここまで来て初めて、3月特殊説(と私が勝手に言っている!)の謎が解けた。シンガポールも、日本も第一波を克服した後に第二波が来たのだ。それぞれのエピデミックカーブは別で扱うべきだというご主張なのだと私は理解している。

3月のどこかの時点で武漢からの新型コロナウィルスはほぼ終息し、欧州・米国からのウイルス株に入れ替わっている*3。専門家会議に入られたただ一人の経済学の専門家、大阪大学大竹文雄先生の資料でも明確にこの区別をされている。
f:id:hihi01:20200523105317p:plain

帰国・入国者検疫スルーは勘定に入れません(個人的メモ) - HPO機密日誌

*1

このブログで書いたように私は専門家会議の大竹先生に厚労省から特別なデータの提供があり「武漢」うんぬんと書いていらっしゃるのだと思っていた。全く違って、中野先生が自身でデータに対して謙虚に見つめられて3月25日(辺り)で第一波と第二波が入れ替わっていることを発見されたのだ。

ちなみに、一貫して増加率が減少していく傾向はレヴィット先生も指摘されているように思える。これはまた別途書く。

youtu.be

更には、倍加日数の扱いとK値の傾き、kが似ていると思うのだが、これは私の手に余る。

f:id:hihi01:20200527141810p:plain

http://www.rcnp.osaka-u.ac.jp/~nakano/note2.pdf

なんかますますまとまらなくなってきたが、一旦アップして読み直して整理する。ふう。文系素人に数学的な要素について書くのはハードル高い!

*1:ちなみに、この時点ではまだ中野先生ではなく、大竹先生がK値を提唱されているのだと勘違いしていた。お恥ずかしい。