【Pandas】.pandas-datareaderを使って株価情報をゲットする。 .no.32


こんにちは、まゆみです。

Pandas についての記事をシリーズで書いています。

今回の記事は第32回目になります

今回の記事では、Pandasの『pandas-datareader』を使って、さまざまな会社の株価情報を取り出してみたいと思います

では、さっそく始めていきますね。

pandas-datareader をインストールする

まずは、コマンドラインを使って、pandas-datareaderをインストールしましょう

どの環境にインストールしたいか決め、その環境をactivate させます。

その後

conda install pandas-datareader

と打ち込めば、インストールが始まります。

インストールが始まる前に下記のスクショのようになります

『pandas-datareader』がちゃんとあるか確かめて

Proceed([y]/n)? の後に、y を入力してエンターを押してください。

(Anaconda のインストールや、conda の使い方が分からない方はこちらの記事を参考にどうぞ)

pandas_datareader を使う

先ほどインストールしたpandas_datareader をインポートします

エイリアス名pdrでインポートしました

import pandas_datareader as pdr

pdr.DataReader()がどのようなパラメーターをとれるのか、

Tab + Shift

を押して、ドキュメントを表示させてみます。


下記のように、ドキュメントが表示されました。

では、株価情報を取るのに必要なパラメーターを1つづつ説明していきます。

パラメーターname

name には調べたい会社の社名を入れます。
ただし、正式名を書くのではなく、3~4文字くらいのアルファベットでできた、『ティッカーシンボル』というものを書きます

(色んな会社のティッカーシンボルを調べてみたいっという人は、こちらのサイトの検索バーで調べてみてください。)

パラメーターdata_source

パラメーターdata_source には、pandas_datareader がどのソースから情報を取ってくるかを引数として書きます。

ただ、そのソース源はよく変更されるので、エラーが表示された時は、色々他の情報ソースを入れてみてください。

今回、私が試した時には、

data_source = "google" にしたらエラーが出ましたが、data_source = "yahoo" では、上手く行きました。

StackOverflowでも、情報ソースとしてgoogle が使えないことに対しての解答がありましたので、貼っておきますね。


引用元:stackoverflow

パラメーター start, end

start には期間の始まりを

end には期間の終わりを引数として渡します

Microsoft とFacebookのそれぞれ指定した期間の株価データは下記のようになります

一番左はしにある『DatetimeIndex』の日付がところどころ抜けているのは、株式市場がお休みの日だからです。

※DatetimeIndexが分からないっていう人はこちらの記事を参考にどうぞ

では、Facebookの株価の詰まったDataFrameをfacebookという変数に代入して、どんなアトリビュートが使えるか見てみましょう

いろんなアトリビュートを試してみよう

facebook. を入力して Tab キーを押すと、どんなアトリビュートが使えるのか提案してくれます。


『values』を使えばnumpy array を返してくれますし、『index』を使えば、インデックスのラベルを返してくれます

他にもたくさんの候補がありますので、是非試してみてくださいね。

まとめ

今回の記事はこれで締めくくらせていただきます。

また後日、これらの株価情報をグラフで示す方法も記事にしていきたいと思います。

どうぞよろしくお願いします!