HPO機密日誌

自己をならふといふは、自己をわするるなり。

汎用性・自動性のあるスプレッドシート

Covid19関連でいくつもスプレッドシートを作ってきた。対外的にはDatatsudioも使った。いまとなってはあまりに稚拙で恥ずかしい内容、表現ではある。途中からimportdata、arrayformula、queryなどスプレッドシートをデータベースとして使いこなす手法を学び、だいぶ汎用性がある形での使い方を学んで来た。結局はいろいろ調べながら、トライ&エラー、そして時々ツイッターでマイスターレベルの方からヒントをいただき、実装という過程であった。

hpo.hatenablog.com

hpo.hatenablog.com

スプレッドシートで現在進行形の現象の分析に使うには、新しいデータをいかに最小限の手間で取り込め続けられるかが肝。できれば自動化したい。そのためには、データと構造をできるだけ分けてスプレッドシートに載せるようにするか。実際、jag-japanさんのデータをフルセットのシートに取り込もうとして、限界オーバーになり別シートにした。症例のケースが5万件近くになればそりゃそうだと。この問題の解決のために、新しいデータ(csv)を別シートで取り込み、importdata等のURLを書き換えるだけで更新できるようにした。

年齢年代別死亡予想 20200810 - Google スプレッドシート

更に、importdataはかなり強力。厚労省のオープンデータを始め、ウェブ上のcsvデータを自動で取り込める。教えていただいた。

更に、地域別にデータを見たいというお声をいただき、試行錯誤の末にピボットテーブルのフィルター機能を使ったシートに改良した。

docs.google.com

フィルターは当然操作できなくなるが、ウェブ公開もサポートしているのは便利かなと。

https://docs.google.com/spreadsheets/d/e/2PACX-1vQOFYho8EKesU-Xu8I5K2sKi0V2IVbsh0tXAynxr2tutCZGkLDCtcm3UCSOFSYR6_7L_3255c44dQqf/pubhtml

まだまだ整理がついていないところがたくさんある。現在は、移動量のデータを最小限の手間で更新できるように苦戦中。すべては現在進行形。