mglearn citibike datasetを使ってみる


mglearn citibikeというデータセットがある。

scikit-learnからロードできる。。


import mglearn
citibike = mglearn.datasets.load_citibike()
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

plt.figure(figsize=(24, 8), dpi=50)
xticks = pd.date_range(start=citibike.index.min(), end=citibike.index.max(),
                       freq='D')
plt.xticks(xticks, xticks.strftime("%a %m-%d"), rotation=90, ha="left")
plt.plot(citibike, linewidth=1)
plt.xlabel("Date")
plt.ylabel("Rentals")

ついでに、季節変動を取り除いてみる。。


import statsmodels.api as sm
res = sm.tsa.seasonal_decompose(citibike, freq=7)

plt.rcParams["figure.figsize"] = (14, 6)
plt.figure(figsize=(24, 8), dpi=50)
res.plot()