pandsモジュールを使ってデータベースからデータを読み出す(転送)

980 ワード

回転:http://www.tuicool.com/articles/ZVzEz2N
 
PythonではPandsでデータ分析を行いますが、最もよく使われているのはDataframeデータ構造です.Pandsの基本的な使い方を紹介した文章を書いていました.その後、ある友達がPandsにデータベースからデータをどのように読み取り、どのようにファイルからデータを読み取るかと聞きました.
1.PandsはMysqlデータを読み、Mysqlのデータを読み取るために、まずMysqldbパッケージをインストールします.データベースをローカルにインストールすると、ユーザー名はmysername、パスワードはmypasswordとなり、mydbデータベースのデータを読み込むと、対応するコードは以下の通りです.
import pandas as pd
import MySQLdb
mysql_cn= MySQLdb.connect(host='localhost', port=3306,user='myusername', passwd='mypassword', db='mydb')
df = pd.read_sql('select * from test;', con=mysql_cn)    
mysql_cn.close()
上のコードはtestテーブルのすべてのデータをdfに読み取りましたが、dfのデータ構造はDataframeです.
2.Pandsはcsvファイルのデータを読み込むPandsはcsvファイルの中のデータを読み取るのは簡単で多く、追加的にプログラムパッケージをインストールしなくてもいいです.もしtest.csvのデータを読み込むなら、対応するコードは以下の通りです.
df = pd.read_csv(loggerfile, header=None, sep=',')
header=Noneは、ヘッダがないことを表し、sep=''は、フィールド間の区切り記号がカンマであることを示します.