Pandas入門:DataFrameの簡単な応用
8140 ワード
Pandas
1、まずpandasとnumpyの2つのパッケージを導入し、pandasはnumpyに依存する.
Pandas , 。 Python Pandas , DataFrame , , DataFrame。
DataFrameの使用1、まずpandasとnumpyの2つのパッケージを導入し、pandasはnumpyに依存する.
import numpy as np
import pandas as pd
時間インデックスを作成します.インデックスは、各行のデータのidであり、一意の値です.date=pd.date_range('20170401',periods=6)
print(date)
結果:DatetimeIndex(['2017-04-01', '2017-04-02', '2017-04-03', '2017-04-04', '2017-04-05', '2017-04-06'], dtype='datetime64[ns]', freq='D')
2、6*4のデータを作成し、randomは乱数を作成するために使用され、パラメータは行数と列数を表し、dateは上に作成したインデックス列である.df=pd.DataFrame(np.random.randn(6,4),index=date,columns=list('ABCD'))
print(df)
結果: A B C D
2017-04-01 -1.174146 0.981851 0.054070 -0.304046
2017-04-02 -0.670757 -0.621248 -0.320604 -0.368905
2017-04-03 -0.008907 0.288560 -0.086716 1.601499
2017-04-04 -0.903410 -0.884107 -0.125471 -0.032931
2017-04-05 -0.589219 -0.561077 -0.994943 -0.001721
2017-04-06 1.503975 1.008683 0.631483 -0.713936
3、dtypesで各行のデータフォーマットを表示できるprint(df.dtypes)
A float64
B float64
C float64
D float64
dtype: object
4、headを使用して前の行のデータを表示する(デフォルトの前の5行)df.head()
# 3
df.head(3)
tailを使用して後の数行のデータを表示し、同じheadを使用します.5、データ・ボックスのインデックス(index)、カラム名(columns)、データ値(values)、記述性(describe)の表示df.index/df.columns/df.values/df.describe
6、Tを用いてデータを転置する、すなわち行列変換.df.T
2017-04-01 2017-04-02 2017-04-03 2017-04-04 2017-04-05 2017-04-06
A -1.056570 -1.314146 -0.882650 -0.081214 -0.061534 -0.558024
B 0.221840 0.915488 -0.689384 -0.707948 0.791983 -0.300867
C -0.572469 -0.987231 -1.123992 0.332304 -0.476678 -0.409462
D 0.582291 0.012441 0.834482 -0.665694 0.765196 -0.020418
7、sortによるデータ並べ替えdf.sort(columns='A')
A B C D
2017-04-05 -0.799361 -0.591627 -0.367348 0.268359
2017-04-04 -0.397003 -0.758888 -2.324696 1.310242
2017-04-01 -0.295905 -0.396839 -1.106580 1.013233
2017-04-03 -0.139464 -0.034839 -0.203179 -1.438849
2017-04-02 0.326524 0.922449 0.199526 0.217041
2017-04-06 0.376355 0.259185 -1.090140 0.060581