HPO機密日誌

自己をならふといふは、自己をわするるなり。

人口予測と感染予測

昨日、永江さんが人口問題の方が新型コロナウイルスより重大であるというツイットをされていて共鳴した。日本は年間百万人以上死ぬ老齢国家だ。少なくとも第一波、第二波で千人以下しか死ななかった新型コロナウィルス禍と比べれば、年間で千倍の重要度といっても過言ではない。永江さんが引用されているエントリーは昨年拝読していた。読んだ当時もどうにもならない日本の状況に大変怒りを覚えたのを記憶している。

世界人口はコロナによる大量死が報告されているにもかかわらず増加が続いている。世界の1億人以上の人口を抱える国で人口減少しているのは日本だけだと。

もとに返って、永江さんのツイットに思わず反応してしまったのは、新型コロナウィルスの感染拡大予測に使われているSIRモデルと人口予測に使われるロジスティックス式、ゴンペルツ曲線のモデルが同様の手法による予測であるからだ。J Satoさんに、今回の感染拡大においてもSIRモデル、集団免疫よりもはるか手前で感染速度が落ちて、S字カーブになる指摘があると教えて頂いた。現在、ゴンペルツ曲線は勉強中。

qiita.com

こうした流れで、以前勉強して、エントリーをおこしたものの中途半端に放置していたこれらのモデルに似たロトカ=ヴォルテラモデルの日本の人口予測モデルをスプレッドシートで改善してみた。

hpo.hatenablog.com

docs.google.com

f:id:hihi01:20200607093254p:plain

ロトカ・ヴォルテラの方程式 - Wikipedia

ざっと係数をWorldmeterの人口データにフィッティングさせた。Worldmeterの日本人口のデータは2018年までが実績。その先は国連の予測値となっている。今回は詳しく述べないが、ロトカ=ヴォルテラモデルの「捕食動物」を65歳以上と仮置きした。この手のモデルでは毎度のことながら、1950年の総人口、65歳以上人口とピークのデータだけで百年先の2050年の人口データにフィットするのはすごいなと。疫学者の方々がSIRモデルに夢中になる気持ちもわかるなと。初期のデータだけで相当先の感染世代まで予測可能にできるのだから。今回は1950年から2050年の百年間の日本の人口推移が二つのデータ、4つのパラメーターでフィットさせた。

f:id:hihi01:20200607093506p:plain
f:id:hihi01:20200607093521p:plain

しかし、2010年のピーク以降がどう係数を操作してもフィットない。ここからのデータを切り分けてフィッティングし直した。

f:id:hihi01:20200607093420p:plain
f:id:hihi01:20200607093910p:plain

ほぼぴたり重なった。係数のうち、65歳以上の「捕食」人口と、65歳未満の「被食」人口の交叉の係数BとCは変えていない。国連の予測、総務省の予測は2010年以前の傾向よりもはるかに「楽観的」に予測を出しているように見える。2010年までフィットしていた特殊出生率と関わりの深い「被食」人口の増加係数、Aが1.7倍。「捕食」人口の減少を示す係数Dが3倍程度になっている。グラフを見ると65歳以上人口の比率があまり増えないように「予測」していたように見える。

あくまでロトカ=ヴォルテラモデルによる素人芸の近似だが、2010年までをフィットさせたグラフから読めば、2050年には総人口が85百万人、65歳以上人口が過半という恐ろしい状況となる。繰り返すがこれは100年単位のモデルへのフィットなので若干の出生率の上昇、65歳以上人口の減少率の増加では結果は大きな変動をしない。有り得るとすれば、SIRモデルと同様これは「閉じた」モデルなので、外部からの大量の流入流入者の桁の違う出生率程度しか、人口維持の策が考えつかない。

感染予測の「四十二万人死亡説」が外れたように、私の「四千二百万人人口減少説」が大外れに外れることを祈るばかりだ。

「新型コロナウイルス 脅威を制する正しい知識」

新型コロナウィルスについての様々な問題を冷静に語ってくださっている。どうしても、ウェブ等の知識だけだと偏りがちなところにお灸を据えられた感じ。水谷先生はど正論を書かれている印象を持った。

新型コロナウイルス:脅威を制する正しい知識

新型コロナウイルス:脅威を制する正しい知識

  • 作者:水谷哲也
  • 発売日: 2020/05/19
  • メディア: 単行本

なんと元記事はウェブで公開済だった!

f:id:hihi01:20200605195453p:plain

http://www.tkd-pbl.com/files/5%E6%9C%88%E5%8F%B7%E3%82%B3%E3%83%AD%E3%83%8APDF.pdf

イラストはこちらも、本書も水谷先生のご自筆によるものらしい。かわいい!

印象に残ったのは、水際対策は有効ではないという部分。

詳細な分析をするまでもなく、鎖国などの措置をしなければヒトが媒介する感染症は(機内検疫、健康申告書、症状の有無調査程度の)水際対策で防ぎようがありません。しかし、たとえ一週間でも国内への侵入を送らせることができるのなら、その間に政府は対策を講じ、報道などを通じて人々の心構えを固めることができます。今となっては判断が難しいことかもしれませんが、SARSのときは水際対策が成功していたために、日本での感染者は皆無であったとも考えられます。

そう考えると、押谷先生のご指摘の千人、二千人の検疫スルーは生じてあたり前だったのかもしれない。

f:id:hihi01:20200605200307p:plain

http://www.gaiko-web.jp/test/wp-content/uploads/2020/05/04_Vol.61_P6-11_Infectiousdiseasemeasures.pdf

冷静に考えてみると、確かにどちらにせよ感染者は国内に入り、感染拡大の様相は大きく変わらなかったのかもしれない。

自分で計算してみた。

f:id:hihi01:20200605200704p:plain
f:id:hihi01:20200605200715p:plain

https://t.co/YEuJuJ6BB4?amp=1

更にワクチンの開発の「シミュレーション」についての説明もあった。ここで感染がかなり押さえ込めた日本の矛盾というか、ジレンマを感じた。

jp.reuters.com

収束期というか、波と波との間のいまこそ、やるべき課題が本書を読んでいると分かる気がする。

IMAX版AKIRA、あるいは人類の災禍の隠喩

もう何回見たかわからない。何回読んだかわらかない。でも、2020年にIMAXで見れる幸せを実感した。

hpo.hatenablog.com

hpo.hatenablog.com

1988年、31年前のフィルムをIMAXの大画面に映し出しても、まったく劣化を感じない。冒頭のバイクのシーンの暴力の迫力にどきどきした。取り調べ、学校、アーミーの本部の描写も細部まで描かれていてCG、デジタル全盛時代のいま見ても違和感がまったくない。大友克洋すごい!よくぞここまで書き込んでいた!*1

いまの時期なので、「AKIRA」に新型コロナウイルス疾病をついつい重ねてしまう。以前から「AKIRA」は人類の災禍の暗喩たりえるとは考えていた。

危機的な状況ほど知見を積み上げるのが大事(個人的メモ) - HPO機密日誌

鉄雄の解き放たれていく「力」。そのもたらす破壊、戦闘、パニック、狂信。新型コロナウイルスの現在進行形の世界への影響を想わせる。新型コロナウイルスにより生じた、大恐慌を上回る不景気、大国の対立、暴動。更にはこれから問題になってくるであろう医療活動の停滞による感染症コンボ。どれだけのパニックが広がるかわからない*2。クライマックス、ラストのAKIRA、鉄雄の力の発現に至っては、新型コロナウイルスの破壊的な力の発現に見えてしまった。*3

新型コロナウイルスも、元はと言えば人類の環境破壊、温暖化、交通網の高速化・緊密化によって加速的に世界的な災禍となった。自分の力の成長に制御をうしなった鉄雄を誰も笑えない。いつかは、この災禍を振り返って人類の進化はあの時「もう、はじまっていた」と言える日は来るのだろうか?

*1:もう全く同感!【レビュー】やっぱり「AKIRA」は凄かった、4Kリマスター版のIMAX試写で打ちのめされる - AV Watch

*2:私は武力衝突、国内暴動が広がるとすればワクチンの開発、リソース分配をめぐってだと考えていた。hpo.hatenablog.comコンテイジョン」を見た時から、米国で医療従事者の職場放棄が伝えられた時から、自分の浅はかさを痛感はしていたが、米国の暴動を皮切りに世界でこんなに暴力が広がるとは想っていなかった。

日本は5月中に緊急事態宣言を解除できたのは本当に僥倖。

*3:余談だが、金田ってどういう存在なんだろうと。幸運力というか、あまりに間が良い。これはもしかして、インターステラのように次元の彼方にいってしまった鉄雄が時間をさかのぼって金田を助けていたのではないだろうか?漫画版でなぜ金田が「あっち」に行ってしまっていたか説明された記憶がない。あとで確かめようかなと。あと、金田のファーストネームってなんだっけかなと?

新型コロナウイルスとべき分布(個人的メモ)

いつか書きたいと想っていたが、緊急事態宣言下では不謹慎のそしりをうけることになると想い控えていた。おりしも、米国では騒乱が起こっている一方、久しぶりの有人宇宙飛行に成功したという。空間、時間、人、事象、いろいろな粗密を強く感じる。

edition.cnn.com
*1

こうした粗密をつながりとして見ると、ごく少数の突出したつながり(リンク、次数)をもつ主体(ノード)と、ほとんどリンクをもたない多数のノードがあることに気づく。そして、スケールフリーネットワーク(SFN)、べき乗則べき分布という概念に行き着く。もう16年もそんなことばかり考えているのになんの進歩もない自分はなんなのだとは想うが、あまりに多くの事象が結果としてべき分布に行き着く。

hidekih.cocolog-nifty.com

hpo.hatenablog.com

前置きはこれくらにして本論。日本における新型コロナウィルス関連疾病(Covid19)が現在小康状態にあるが、今後を考える上でネットワークとしての感染経路を考える必要がある。空間密度と捉えると、空間と時間において人の密度はべき分布している。この事例では空間は縦と横、密度掛ける密度になるので、空間における人の密度の減少率の2乗に比例して人と人との接触が減るという。

xtech.nikkei.com

そもそも、有名な「クラスター対策班」のクラスターはネットワーク概念。そして、西浦先生がごく初期の段階で新型コロナウィルスの感染のべき分布に気づいて論文化されていたために「クラスター対策班」が生まれた。中澤港教授がわかりやすく解説してくださっている。

SARSは右裾を引いたべき分布に近い形でした。これは、ほんとどの人が他の人に感染させなかったり1人、2人にしかうつさないのに、裾野のところで、人数は少ないけれど、時々、たくさんの人にうつす人がいる、みたいなイメージです。少数の人がスーパー・スプレディング・イベントみたいなことを起こして全体としてのRを押し上げているので、平均値(相加平均)と最頻値が一致していません。Rが同じでも、かなり感染の仕方が違うわけです
f:id:hihi01:20200531055535j:plain
(中略)
「こういった違いはネットワーク論的にも説明できます。誰もが同じ確率で接触するランダムネットワークだと、接触数の分散が小さく、接触回数の分布を見ると、ベルカーブに近くなります。一方で、スーパー・スプレディング・イベントがあって、接触回数がべき分布になるようなネットワークは、いわゆるスケールフリー・ネットワーク です。これは、どの一部をとっても全体のネットワークの縮図になっているような形で、少数のハブだけが多くのリンクを持っているのが特徴です」
f:id:hihi01:20200531055547j:plain

新型コロナの広がり方:再生産数と「密」という大きな発見 | ナショナルジオグラフィック日本版サイト

素晴らしいのが3月の時点でショーンKYさんがこの事実はきちんと指摘され、図まで作成されていること。負けた!(笑)

f:id:hihi01:20200531055734p:plain

経産省さん、新型コロナウイルス対策のガイドライン求む|ショーンKY|note

そもそもを辿れば、2015年の時点で西浦博先生がSARS、MERSのべき分布を二項分布の式で近似している。

SARS、MERS)どちらも1人の感染者あたりが生み出す二次感染者数にバラつきが大きいことである。ほとんどの感染者は二次感染者を生み出さないか、二次感染が起こっても二次感染者数は数人程度で済む。しかし、一部の感染者だけが他と比較して非常に数多くの二次感染者を生み出すスーパースプレッダーとなる。
(中略)
f:id:hihi01:20200531060141j:plain
(1)kが0に近ければ近いほど分散が大きく、裾の長い分布となる。kが1のとき、(1)式は幾何分布と同じであり、kが無限大のとき式(1)はポアソン分布である。
f:id:hihi01:20200531060417j:plain
この式では図Aの観察データに基づくパラメータR0やkの推定を実施することができない。(1)式に基づく分岐過程を用いて確率母関数を記述し、その微分を解くことで1人の輸入感染者が侵入した際に期待される総感染者数(図Aに相当する確率分布)が次のように導かれる。
f:id:hihi01:20200531060511g:plain
同様に、期待される感染世代数の確率分布も解析的に導かれ、最尤推定法を用いることでパラメータ推定を実施した。

数理モデルを用いたMERS輸入後の2次感染発生リスクの推定

推定したパラメーターに基づいて推定された「最大感染世代数」が引用中の図Bとなる。つまり、ランダムネットワーク、一様な感染経路に比べて、二項分布もしくはポワソン分布で近似された(と私が考える)べき分布であればパラメーターによっては感染率が感染世代によってぐっと低くなることを示唆されている。このために、SARS、MERSでは「自然消滅」したのだろう。今回のSARS-COV-2、Covid19においては重篤しない感染初期段階で感染力が最大になり、発症してからはほとんと感染させないことが知られているので少し違ってくるはずだが、異質性のある感染経路は同じであろう。更に、ここに年代別の感染の違いも出てくるが議論が複雑になるので触れない。

スケールフリーネットワークのキーワードで更に論文を探したところ、同様の見解の論文がいくつか見つかった。

f:id:hihi01:20200531061315p:plain

https://arxiv.org/abs/2004.00067

この論文はCovid19について仮にR02.5でもその後の集団免疫成立、感染速度鈍化がはるかに少ない割合で成立することを指摘しているように私には読める。

静岡大学の守田先生の論文も見つかった。

Abstract
Spreading phenomena are ubiquitous in nature and society. For example, disease and information spread over underlying social and information networks. It is well known that there is no threshold for spreading models on scale-free networks; this suggests that spread can occur on such networks, regardless of how low the contact rate may be. In this paper, I consider six models with different contact and propagation mechanisms, which include models studied so far, but are apt to be confused. To compare these six models, I analyze them by degree-based mean-field theory. I find that the result depends on the details of contact and propagation mechanism.
(試訳)

拡散現象は自然や社会の至る所にあります。たとえば、病気や情報は、根底にある社会的ネットワークや情報ネットワークにより広がります。スケールフリーネットワークでモデルを拡散するための閾値がないことはよく知られています。これは、接触率がどれほど低くても、そのようなネットワークで拡散が発生する可能性があることを示唆しています。この論文では、これまでに研究されたモデルを含む、接触カニズムと伝播メカニズムが異なる6つのモデルを検討します。これらのモデルは得てして混同されがちでした。これら6つのモデルを比較するために、次数に基づいた平均場理論によってモデルを分析します。結果は接触と伝播メカニズムの詳細に依存することがわかりました。
(中略)
f:id:hihi01:20200531095736p:plain
(試訳)
f:id:hihi01:20200531095754p:plain
(中略)
f:id:hihi01:20200531061936p:plain

https://www.nature.com/articles/srep22506

SIRモデルにおいてもR0の少しの差が大きな感染の差を、それこそ二桁、三桁もの産むことになる。SFNべき分布においてはまして初期パラメーターが大きく結果に差を生む。正直、モデルの差をきちんと説明できるほど私の理解は進んでいないが、守田先生のMode 2bはCovid19のエピデミックカーブによく似ているように私には見える。

f:id:hihi01:20200531062248p:plain

https://ig.ft.com/coronavirus-chart/?areas=usa&areas=gbr&areas=jpn&areasRegional=usny&areasRegional=usnj&cumulative=0&logScale=1&perMillion=0&values=cases

で、この考え方がなんの役に立つのかと聞かれれば、今後の経済と感染抑制の両立させる対策に影響すると考える。いや、本家本元の西浦先生が論文を5年も前に書いていらっしゃるので、すでに折り込み済だよと言われるとは思う。言うまでもなく、既に空間状況におけるべき分布の裾野(スーパー感染)の事例は、三密であることが明らかになり対策が取られている。あと、なかなか抑制できていない夜街クラスターと院内、施設内感染についての緊急の対策が大変重要だということになる。更に、重篤化もべき分布、粗密があるのでこの因子の特定がとても重要となる。すでに、Rtが1を超えたと伝えられている。しかし、5月末現在報告されているRtは二週間程度前、5月半ばの感染速度を示していることになる。つまりは、多大な経済的損失に見合う抑止ができていないということになる。

ここでまた私の素人資産でどんなに重篤化、死亡を抑制したとは言え言って来いで月間10兆円を超える社会的損失に見合わない対策だとしか評価できない。

hpo.hatenablog.com

あとは、いうまでもなく年齢による異質性とそれにより生じているべき分布の可能性だ。前述のようにこれは私の手にはあまる。以前の年齢別の重篤化率のエントリーを置いてここについては終わる。

hpo.hatenablog.com

書き始めた時は、もう少しよい対策を提言できそうに想って書き出したのだが、いまは思いつかない。感染のべき分布の差が各国で大きくことなる感染の推移を説明するようにも想える。継続して考えていきたい。とにかくべき乗則なので、ごく少数の感染させる方々のために経済を止めることはあってはならないとは考えている。

*1:状況の推移については、こちらのツイット連投に詳しい。

「感染症パニックを防げ :リスクコミュニケーション入門」

久しぶりに本屋に入って手にした。大変興味深く拝読した。誰もが新型コロナウィルスの不安に悩み、いろいろな場面でリスクをどう受け止めるかという課題を抱えている中、広く読まれるべき本だと想う。

冒頭、大変重要な概念が解説されている。

リスク・コミュニケーションは、
リスク・マネージメント
リスク・アセスメント
という3つの概念と一緒に三位一体となって行います。

リスク・アセスメントについては、発熱患者の外来を担当した研修医のカルテルの書き方を例に分かりやすく説明されている。リスクを「除外」するのではなく、症状を単に記述するのではなく、「恐らく肺炎、しかし尿路感染症の可能性も少しはある、肋膜炎の可能性は否定的だが、除外しきてれいない」というように「ウェイトを持たせてリストアップ」するだけでも、先の展開が違ってくると。

当然、無限に診察、検査することはできずアセスメントは必ずしも正解にはならないと。それでも、対応策をとにかく決めなければならない。この辺が岩田先生が現場の臨床の場面を多数経験されている迫力を感じる。いつも、ツイートでもつぶやかれているようにマネジメント、意思決定においては複数の対策を用意し、プランAがだめならプランBと、対応を「ボクサーのように」柔軟に行えることが大事だと。

その上で、メンタルモデル、社会構成主義などの概念を援用し、どのような言葉、どのようなモデルで伝えるべき周囲にリスクを伝えるかを詳述されている。大変、勉強になった。私も日々同僚、部下、あるいはクライアントにリスクを含む事態を伝えなければならない。相手がどのようなモデルを自分の中にもっているか推測しながら、そのモデルにあった「言葉」、「比喩」を探すことの重要さを痛感することがある。

「社会構成主義」とは哲学、社会学でいう社会構築主義、social constructionismの米国医学界的展開での用語なのではないだろうか?宗教社会学の授業で若干学ばせていただいた記憶がある。主観、客観の様々な要素が結びついて社会的な様態や、個人の社会内における思考、行動が生まれると理解している。例えば、宗教のように不合理であるが人を強く動かす動機が内在している。お医者さんはすべて、医学的な合理性に基づいて、診察し、意思決定し、それを患者に伝えるのだと私など素人は想っていたので、この考え方、そして、患者の意見に耳を傾ける大切さを岩田先生が書かれていたことに正直驚きを覚えた。

社会学における社会構築主義
ジークムント・フロイトとエミール・デュルケムの著作を範にして社会構築主義理論を応用した例として、宗教に関する研究がある。この考え方によれば、宗教の基礎には、人生の目的を欲するわれわれの意識がある。従って宗教は、客観的現実の隠された様相をわれわれに見せているのではなく、人間の必要に応じて社会的かつ歴史的な過程を経て構築されたものである。『聖なる天蓋』という著作で、ピーター・L・バーガーは宗教の社会的構築を描いている。

社会構築主義 - Wikipedia

本書、287ページからの岩田先生ご自身が北京でSars-cov-1の対応をされた時の経験がごく簡単にだが書かれている。医学的にはまさにリスク・アセスメント、リスク・マネージメント、リスク・コミュニケーションをフルに活用されたことが緊迫感とともに伝わる。しかし、本書執筆の2014年時点において、SARSが発症した場合の終息について、以下のように書かれていることが重い。

「現在は問題になっていませんが、将来の見通しは立っていません」

それにしても、ダイアモンドプリンセス号の時の行動については確信犯であったのだと改めて「確信」する。各国での臨床体験はもちろん、講演活動、厚労省への専門家アドバイザーのご体験、ブログからツイッター、動画配信まで2014年の時点でこれだけプロフェッショナルな方が、カジュアルにああいう動画を公開するとは想えない。先日も西浦先生について書かれていたように、ここで警鐘を鳴らしておかなければならないという信念の結果の行動であられたのだろう。

www.bbc.com

2009年の新型インフルエンザの時には、西浦先生はまだ国の政策に対してほとんどコミットしていなかったと思います。そして、あの時は、西浦先生がされているような数理モデルを活用した感染対策なんてほとんどなかったんです。

当時を思い返すと、厚労省が勝手に描いた「死亡率2%のインフルエンザ」というポンチ絵を根拠に全部計画を立てました。もちろん、この「2」という数字はさしたる根拠もない「シナリオの一つ」に過ぎないのですが、厚労省はともすると、自分の想定した物語をあたかも真実であるかのように振る舞う悪弊が昔からあります。

当時は、現実・データ・ファクト・サイエンスといったものを基に政策を決めることがなく、むしろ観念や手続き、形式が優先されていたわけです(今でも、多分にそうです)。蓋を開けてみたら死亡率2%でもなんでもなかったのですが、そのせいで方向転換も遅くなって現場も大変でした。軽症、あるいはすでに治癒したインフル患者を重症扱いで対応しなければならなかったからです。

そこから考えると今回の新型コロナウイルスの対策では、データやモデルを活用し、それを基にした推論を根拠にして、いわばevidence-based health policy(エビデンスに基づいた医療政策)でいきましょう、という流れができたわけです。これは大きな前進です。

【岩田健太郎医師「感染爆発を押さえた西浦博先生の『本当の貢献』とは」【緊急連載】】 | BEST T!MESコラム

K値のDIY、感染は指数関数的増加ではない(個人的メモ)

前回、K値について理解を深めるためのエントリーを書いた。今回は自分の手持ちのデータをもとにDo It Yourselfで計算してみた「感想」。

hpo.hatenablog.com

K値が示しているのは新型コロナウィルスの感染は、各国のデータを見ても指数関数的ではなく増加率を線形近似すれば常に低下していくことだと私は理解している。

まずは、スプレッドシートへのリンク。

docs.google.com

2月初旬から5月6日までのDIYしたK値のグラフ。

f:id:hihi01:20200529100745p:plain

中野先生ほどきれいなグラフにならないは、はずれ値を除外していらっしゃるからだろうと推測する。そこで、かなり力業に近いがK値が下降している期間を武漢ウイルス株、欧州ウイルス株にわけてグラフ化した。線形にK値が下降している。

f:id:hihi01:20200529101249p:plain
f:id:hihi01:20200529101302p:plain

前回示したように増加率とKはマイナスの反比例関係にある。

1 / (1-K) = D7 / D1 = 増加率

ややこしいので表にした。

f:id:hihi01:20200529103357p:plain

K値が下がることは各時点での増加率が下がっていることを意味する。ということは、現在の日本、各国のように「集団免疫」が成立するよりはるか手前の段階で感染者総数は指数関数的な伸びにはならないということになる。実際、感染者総数のグラフに指数関数と二次関数で近似させて相関係数を取ると、二次関数の方が相関が高かった。

まずは武漢ウイルス株、第一波と思われる時期。

f:id:hihi01:20200529103943p:plain
f:id:hihi01:20200529103954p:plain

次に4月ということは、ピーク以降の第二波、欧州ウイルス株。

f:id:hihi01:20200529104053p:plain
f:id:hihi01:20200529104106p:plain

この問題は以前、SIRもどきの私のDIYモデルの時には時点が先へいけばいくほど、モデルと実際の感染者数との差が出る問題として気がついてはいた。

f:id:hihi01:20200529104530p:plain

日本のPCR陽性者は0.6%存在するのか?(個人的なメモ) - HPO機密日誌

ちなみに、数IIまでしかやっていない私には説明が難しいのだが、K値、あるいはK値の線形近似のXに対する係数-0.01程度のK'=kは、指数関数的増加、あるいはSIRモデルが想定する同じβを次々と掛けていく予測では、現れないはず。

f:id:hihi01:20200529104802p:plain

指数関数y=a^xの微分公式の4通りの証明 | 高校数学の美しい物語

2月のうちに中国の増加は指数関数ではないと示されたレヴィット教授の見解を日本のデータでも示したことになると解釈している。

Rtは期間によって、だいぶぶれが大きい。K値でも一週間単位なのでK値そのものでは緊急事態宣言以降の単発的な感染者の発生が「セーフ」なのか「アウト」なのか、「オーバーシュート」の前触れなのか分析が難しい。ただ、少なくとも現在の日本の状況で再度「開国」しない限りは指数関数的増加にはつながらないことを示す方法はないか考えたい。えっと、あくまで素人芸だが。

K値の線形的わかりやすさとデータに対する謙虚さ(個人的メモ)

どうしても指数関数的、折り込み的な増加は一般に理解しがたい。いや、私も文系素人なので人のことは全く言えないのだが、今回の新型コロナウィルスのような場合はこの違いが顕著になる。

正直、当初、K値について聞いた時はなんと単純な指標だろうと。これでは指数増加と矛盾しないか?、それでもなくても複雑な状況で新しい指標でなにをと理解に苦しんだ。自分のツイートを検索すると最初にK値に触れたツイートが出てきた。5月9日付だった。自分の不明を恥じたい。ちなみに、この二つの山のグラフがとても重要だと最近理解した。あとで説明する。

大阪大学核物理研究センター長の中野貴志教授は、1から「1週間前の総感染者数を当日の総感染者数で割った値」を引く数式(K値)を提案しています。この数式では感染が収束すると0になります。Our World in Dataのデータをもとにシンガポールの感染状況をグラフにしてみました。

f:id:hihi01:20200527124117p:plain

シンガポールとよく似た日本の状況)
f:id:hihi01:20200527130627p:plain

中野先生の「ノート」にK値が定義されていた。

f:id:hihi01:20200527124912p:plain

http://www.rcnp.osaka-u.ac.jp/~nakano/note1.pdf

これは、

𝐾 = 1 − 1週間前の総感染者数(D1) / 当日の総感染者数(D7)
 = D7 / D7 - D1/D7= (D7 - D1) / D7

となり、「過去1週間の新規感染者の合計を当日の感染者数で割った比率」となる。この時、ちょうどRt値について考えていて、更には教えを請うていたので、なるほどとは想った。

以前から2月6日以降の厚労省のデータを自分のスプレッドシートで計算していた。しかし、Rtの計算方法がいまいちぴんとこなかった。そこでフィナンシャルタイムスに載っていた倍加日数に注目した。倍加日数を計算するのは、一定期間の「増加率」から計算する。K値は7日だが、私は10日と5日で計算した。K値は「感染者の増加傾向の減少」を対象にしているので1から0の値にしているのに、対し私は倍加日数計算のために一日当たりの増加率を計算していた。以下の式のD2、D12はそれぞれ10日前、当日の感染者総数を意味する。

増加率 = round(D12/D2,4)
1日当増加率 = power(D12/D2,1/10)
倍加日数 = log(2,一日当増加率)

https://twitter.com/hidekih/status/1262617935916396545

ちなみに、

K =1- D1 / D7
K -1 = - D1 / D7
1-K = D1 / D7
1 / (1-K) = D7 / D1 = 増加率

となる。

実際は、7日間なり、10日間の増加率のべき乗によってKが求められることになるのだが、言わば増加率の逆数となる。更に、「単利」で計算しているここと同じ。ここがK値の線形性のわかりやすさかなと。増加はしていても、増加速度は落ちている。日毎のK値を計算しているので、言わば移動平均をしている。K値が一貫して減少してるグラフは、全体から言えば弓形になる。例えば、米国の総感染者(正確には現感染者)のカーブのイメージ。

f:id:hihi01:20200527141415p:plain

https://www.worldometers.info/coronavirus/country/us/

これが中野先生の大発見(少なくとも私にとっては!)につながる。

f:id:hihi01:20200527133344p:plain
値が大きく変化する領域では、~0.04/day の変化率で K の値が線形に減少している。K の変化が線形からずれる 2 月 26 日で K 値は 0.005 である。これは前週(2 月 19 日)と比べて、総感染者数が 5%増加したことを示す。4 月 14 日の段階で中国の K 値はさらに一桁小さくなっている。

ここで計算されたK値が線形に減少している!これを各国に当てはめられ、一貫していることを発見された。

その上で、中野先生は最初に示した言わば「N」字型、減少傾向が一次上昇し、更に減少傾向になっている日本のK値の謎を解く。

f:id:hihi01:20200527133542p:plain
総感染者数を3月25日でリセットした結果、日本でもK値がほぼ線形に単調減少している。最後の7点を直線で外挿すると感染収束予想日として5月5日が得られる。(リセット日を3月27日にすると予想日は5月2日になる。)また、収束以前でもK値が予想できれば、その値の変化に基づいて、新規感染者数の推定も可能である。

ここまで来て初めて、3月特殊説(と私が勝手に言っている!)の謎が解けた。シンガポールも、日本も第一波を克服した後に第二波が来たのだ。それぞれのエピデミックカーブは別で扱うべきだというご主張なのだと私は理解している。

3月のどこかの時点で武漢からの新型コロナウィルスはほぼ終息し、欧州・米国からのウイルス株に入れ替わっている*3。専門家会議に入られたただ一人の経済学の専門家、大阪大学大竹文雄先生の資料でも明確にこの区別をされている。
f:id:hihi01:20200523105317p:plain

帰国・入国者検疫スルーは勘定に入れません(個人的メモ) - HPO機密日誌

*1

このブログで書いたように私は専門家会議の大竹先生に厚労省から特別なデータの提供があり「武漢」うんぬんと書いていらっしゃるのだと思っていた。全く違って、中野先生が自身でデータに対して謙虚に見つめられて3月25日(辺り)で第一波と第二波が入れ替わっていることを発見されたのだ。

ちなみに、一貫して増加率が減少していく傾向はレヴィット先生も指摘されているように思える。これはまた別途書く。

youtu.be

更には、倍加日数の扱いとK値の傾き、kが似ていると思うのだが、これは私の手に余る。

f:id:hihi01:20200527141810p:plain

http://www.rcnp.osaka-u.ac.jp/~nakano/note2.pdf

なんかますますまとまらなくなってきたが、一旦アップして読み直して整理する。ふう。文系素人に数学的な要素について書くのはハードル高い!

*1:ちなみに、この時点ではまだ中野先生ではなく、大竹先生がK値を提唱されているのだと勘違いしていた。お恥ずかしい。