新型コロナ陽性者数をQuickSightで予測してみた
はじめに
AWSのBIツールQuickSightにて、ノーコードで機械学習を用いた予測ができるとのことで
最近よく目にする新型コロナ陽性者数で試してみました。
また、データの自動更新についても試してみました。
データソース
新型コロナ陽性者数のデータはオープンデータとして厚生労働省のサイトで公開されています。
https://www.mhlw.go.jp/stf/covid-19/open-data.html
この中から陽性者数をダウンロードして使います。
方針
ダウンロードしたファイルpcr_positive_daily.csvを直接QuickSight(SPICE)に取り込みでもいいのですが、
ここではS3に保存してそれをQuickSightのSPICEに取り込むようにします。
理由:
このデータは日々更新されていくので、この出来上がったグラフも最新データに追随していかせたいのです。
データソースがS3だと自動更新させて追随させることができるのですが、
ファイルのアップロードだと自動更新できないのでこうします。
自動更新の方法については後述。
S3にアップロード
手動でダウンロードしたファイルをS3にアップロードします。
今回は以下の場所にアップロードしたとします。
s3://dummy_bucket/hogehoge/pcr_positive_daily.csv
マニフェストファイルの準備
pcr_positive_daily.csvを開くと、以下のようなデータであることがわかります。
日付,PCR 検査陽性者数(単日)
2020/1/16,1
2020/1/17,0
2020/1/18,0
以下略
ですので以下のような記述のマニフェストファイルを用意します。
{
"fileLocations": [
{"URIs": ["s3://dummy_bucket/hogehoge/pcr_positive_daily.csv"]}
],
"globalUploadSettings": {
"format": "CSV",
"delimiter": ",",
"containsHeader": "true"
}
}
それぞれの項目の意味などはこちらを参照してください。
QuickSight > ユーザーガイド > Amazon S3 のマニフェストファイルでサポートされている形式
QuickSightのバケット許可
QuickSightにS3のバケットdummy_bucketにアクセスできるよう許可を与えます。
QuickSight右上のアイコン > QuickSightの管理 > セキュリティとアクセス権限
QuickSightのAWSサービスへのアクセス の 追加または削除する をクリック
Amazon S3の説明文にある 詳細 のリンクをクリック
S3バケットを選択する
目的のバケットであるdummy_bucketにチェックを入れて 完了 します。
取り込み
QuickSightの左のサイドバーのデータセット > 新しいデータセット > S3
データソース名は適当に(ここではcovid19_allにしています)。
マニフェストファイルのアップロードでは先ほど作成したマニフェストファイルを指定します。
接続ができたら確認してみましょう。
、、、日付カラムが文字列型として認識されてしまってますね。
データ型を指定してあげましょう。
分析
先ほど作ったデータソースをもとに分析を作り、そこに今回の目的である予測を追加します。
グラフ化
X軸に日付、値にPCR検査陽性者数を指定して折れ線グラフを描画します。
ラベルのフォーマットなどをいい感じに整えましょう。
予測を追加
自動化
元のデータが更新に追随してQuickSightも更新されるよう、自動化します。
Lambdaでデータを取得して、データセットを更新するように設定します。
Lambda
Lambdaで厚生労働省のサイトからデータをダウンロードしてS3に保存するように記載します。
保存先は先ほどマニフェストファイルで指定した
s3://dummy_bucket/hogehoge/pcr_positive_daily.csv
になるようにします。
詳細は割愛。
トリガーで日次バッチとして動くように設定します。
データセット
QuickSightのTopからデータセットを開き、
先ほど作ったcovid19_allのデータセットを開きます。
更新スケジュール から日次で動くようにスケジュールを設定します。
おわりに
以上、機械学習に関する知識なしに簡単に予測のグラフを描画できました。
長々と書きましたが、グラフさえ描画できてしまえば、
メニューから予測を追加するだけと非常に簡単なので利用機会が出てきそうです。
Author And Source
この問題について(新型コロナ陽性者数をQuickSightで予測してみた), 我々は、より多くの情報をここで見つけました https://qiita.com/_konishi_/items/c5ccbfaf3c54ce06cfeb著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .