Python Pandsデータ構造を簡単に紹介します。
Series
Seriesは一次元配列と似ています。データセットと関連データラベルセットからなります。pansdasのSeriesクラスを使って作成できます。
DataFrameは、一組のデータと一組のインデックスからなるデータ構造で、行索引と列索引があります。エクセルと似たようなテーブル型のデータ構造です。以下は簡単なデータフォーマットです。
以上が本文の全部です。皆さんの勉強に役に立つように、私たちを応援してください。
Seriesは一次元配列と似ています。データセットと関連データラベルセットからなります。pansdasのSeriesクラスを使って作成できます。
import pandas as pd
s1 = pd.Series(['a', 'b', 'c,', 'd'])
print(s1)
# : 0 a
# 1 b
# 2 c
# 3 d
# dtype: object
上には、1つのリストが入ってきます。上の0、1、2、3はデータのデフォルトラベルです。また、index属性によるカスタムラベルも使用できます。
s2 = pd.Series(['1', '2', '3,', '4'],index=['a', 'b', 'c,', 'd']) # index
print(s2)
またSeriesは辞書でも参照できます。
s3 = pd.Series({'a':1,'b':2})
print(s3.values) # values
Data FrameDataFrameは、一組のデータと一組のインデックスからなるデータ構造で、行索引と列索引があります。エクセルと似たようなテーブル型のデータ構造です。以下は簡単なデータフォーマットです。
0 python
1 Java
DataFrameクラスでは、リストに入ることができます。dataframeのテーブルデータオブジェクトを実際に例化します。このとき、行と列のインデックスはデフォルトで0です。よくあるのは、入れ子のリストです。入れ子の中のリストも元祖としてもいいです。インデックス行列のインデックスを指定しないと、0から1から増加します。また、columns、indexによって定義された列の索引と行のインデックスを作成することができます。詳細は下記のコードを参照してください。
import pandas as pd
df2 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')]) # , ,
print(df2)
出力のフォーマットは以下の通りです。
0 1
0 a A
1 b B
2 c C
3 d D
df3 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')],columns=[' ',' '])
print(df3)
0 a A
1 b B
2 c C
3 d D
DataFrameクラスでは、1つのdataframeのテーブルデータオブジェクトを辞書に入れて実装することもできます。このとき辞書のkeyは列インデックスに相当します。このとき、行インデックスはデフォルトですか?それとも0から開始しますか?また、indexによって定義された列インデックスから来ることもできます。以上が本文の全部です。皆さんの勉強に役に立つように、私たちを応援してください。