東京と東京以外の新型コロナ感染者数を比較してわかったこと

なぜか見かけない「東京以外」の合計


走りながらニュースをチェックしているので日本の状況も日々目と耳に入ってきている今日この頃。

これまで東京の増加ばかりが騒がれていたが、最近では全国での増加も取り上げられることが多くなったように感じる。



それなら東京と東京以外の比較はないかなと思って探してみたものの、意外とない・・・。

ニュースで出てくるのは全国の感染者数一覧のみで推移が見れるものではなかったり、棒グラフが出てきても東京のみだったり、全国合計だったり、個別道府県(大阪や沖縄)だったりで、「東京以外の合計推移」というのがあってもよさそうなのに見つけられなかった。



それなら掲載されている統計データから自分で見てみようかなと思って調べて見ると、厚生労働省が都道府県別の感染者数を公表していた。



が、PDFの表形式ということで、これでは「東京以外の合計推移」を見るには厳しい・・・。



ここまで来たら乗りかかった船なので自分で集計してみようという気に。

コロナ感染者数なんて世界中でいろんな企業や個人が集計しまくっているので今更感も半端なく、車輪の再発明に他ならないが、ちょうど最近Power BIを使い始めたのでPDFから直接データを取って、グラフ表示するのも簡単にできるんじゃないか・・・という甘い目論見で走り出してしまった・・・。

都道府県別感染者データ集計


ということでPower BIのPDF内のテーブル読み込み機能を試してみたが、それなりに読み込めるものの、Power Queryを使ってひとつひとつ成形していくのがけっこう手間で厳しい・・・(単に自分がPower Queryを使いこなせてないだけだが)。

これじゃあとても簡単にはできんなと思って読み込みと成形はPythonでやることに。

ということでPythonでPDFからデータを成形して・・・



Power BIに読み込んで、集計用のメジャーを作成したりの前処理をしてからグラフ作成。



とはいえここでも予想外の動作もあって当初の目論見のように簡単にできたわけではなかった。

地図上に落とし込んだときも、なぜか台湾に「三重」が表示される・・・



もしやと思ってググってみると、はたして台湾にも三重区というのがあって正しくマッピングされず、「三重県」にしないとダメというオチだった(ちなみに自分で経度緯度情報を入れてマッピングすることもできるがさらに手間がかかる)。



なお、台湾の三重区は新北市の中の1行政区ということなので、行政区分の規模的にもマイクロソフトには日本の三重県の方をデフォルトにして欲しかった。

東京都と東京都以外合計の比較


ということでやっと本来見たかった「東京 VS 東京以外連合」のグラフがこちら

まずは累計感染者数の推移比較。水色が東京で紺色が東京以外合計。ちなみにもちろんだが両方足せば全国合計になる。



こうしてみると7月30日までのデータしかないものの、直近になってぐぐっと東京以外の増加が顕著になってきていることがわかる。

そして日ごとの新規感染者数を東京と東京以外合計で比較したのがこちら。



7月18日は東京都だけで他の合計を越える新規感染者が出ていたが、直近では東京にダブルスコアやトリプルスコア以上の差をつけて東京以外の新規感染者が急増している

これまで東京の感染者数がクローズアップされてきた経緯もあってか、直近でも連日の過去最多や472人とか騒がれているが、報道的にはむしろ東京以外にフォーカスしていくのが正しい警鐘の鳴らし方なのかもしれない

さらにグラフを見てみると、東京と東京以外の違いが顕著になったのが7月20日の新規感染者数

この日一気に東京以外連合が東京都にダブルスコアをつけ、東京以外の感染拡大を判断するターニングポイントとなったことがわかる。



その発表があった20日~21日、自分が見た限りではそこが強調された報道は見なかったけど、当時どうだったんだろうかと気になり、グーグルのニュース検索でその発表があったであろう7月20日~7月21日のニュースを検索してみた・・・。



こうしてみると、当時ヘッドラインを飾っていたのは東京や米軍基地での感染拡大だったようだ・・・。

変な勘繰りはしたくないが、折しも東京抜きで22日から開始されたGo Toキャンペーンの直前ということもあり、政府やそれを忖度する人たちにとっては東京以外の数に最も触れたくないタイミングだったのかもしれない・・・。

0 件のコメント :

コメントを投稿