covid19の推移


covid19の感染者数の推移

1. matplotlibで可視化。

使用したデータは、covid19jpのリンク先の厚生労働省のデータを使用しました。
データ・セットは東京、大阪、愛知のみで、最新ではありません。
使用したデータは元データを表計算やsql等で、抽出・加工したものを使用。
jupyterでpandasのdataframeにしたものを、plot関数で可視化してみました。

graph_toumeihan.py

#!/usr/bin/env python
# coding: utf-8
#
# 東京・大阪・愛知の感染者数を日次で集計したファイルからグラフ化
# 読み込むファイル名: toumeihan_total_df.csv
# 
import pandas as pd
import matplotlib.pyplot as plt
import japanize_matplotlib

# csv読み込み
df = pd.read_csv('./toumeihan_total_df.csv' ,index_col=0)

# plotで可視化
# グラフの保存 :plt.saveは、plt.showの前に実行
# 処理の順番を入れ替えると、ファイルに何も保存されない
get_ipython().run_line_magic('matplotlib', 'inline')
plt.figure()
df.plot(title='感染者数の推移'
        ,figsize=(10 ,8)
        ,grid=True)
plt.ylabel('日次感染者数')
plt.xlabel('公表日')
plt.plot([1 ,2],[3 ,4])
# グラフ保存
plt.savefig('./toumeihan_line_transition.jpg')
plt.show()

スクリプトのplt.show()の前に、plt.savefigを実行すると、ファイルは出来るのですが、グラフは出力されていませんでした。

データ

事前にオフィスやsqlで、次の様な2つのカラムのデータに加工しました。
PublicationDateは、公表日
Patientsは、日次で東京・大阪・愛知の感染者数の合計です。

PublicationDate,Patients
2020-01-01,0
2020-01-02,0
2020-01-03,0

【情報源】
signate https://signate.jp/competitions/261
COVID-19 Japan 新型コロナウイルス対策ダッシュボード https://www.stopcovid19.jp/
データと予測モデルの正確性を保証するものではありません。また、データは基本的に厚労省・自治体等の症例データに基づいて作成、各種機関が発表している統計データと一致しないことがあります。