Dataframeの行名および列名のソート
前言:
pandasはPythonがデータ処理を行う強力なパケットであり、データ処理を行う際にDataframe形式のデータに関する調整とソートをよく使用します.以下は行列操作に関するまとめです.
列の名前変更:
データ処理時に設計されるカラム名が使用したいカラム名と一致しない場合があります.コードを使用してheaderの名前を変更できます.
これでカラム名のソートが完了します
列名の変更
設定されたカラム名が不適切な場合、フォーマットが一致しない場合があります.次の方法で各カラムのカラム名を直接変更できます.
行のソート
ある列の値に従ってDataframeに対して行の並べ替えを行って自分の望む並べ替えの順序を得ることができます
pandasはPythonがデータ処理を行う強力なパケットであり、データ処理を行う際にDataframe形式のデータに関する調整とソートをよく使用します.以下は行列操作に関するまとめです.
列の名前変更:
データ処理時に設計されるカラム名が使用したいカラム名と一致しない場合があります.コードを使用してheaderの名前を変更できます.
df = pd.read_csv(path, header=0)
print(df)
close date high low money open time volume
0 66.48 2020-01-02 66.48 65.85 5722474 66.01 09:31 866
1 66.30 2020-01-02 66.48 66.18 2646681 66.22 09:32 399
2 66.37 2020-01-02 66.39 66.16 1279115 66.17 09:33 193
3 66.45 2020-01-02 66.45 66.37 4130439 66.39 09:34 622
4 66.28 2020-01-02 66.48 66.28 2149783 66.45 09:35 324
... ... ... ... ... ... ... ... ...
5755 84.17 2020-02-27 84.22 84.12 3081344 84.12 14:56 366
5756 84.17 2020-02-27 84.19 84.14 2263360 84.17 14:57 269
5757 84.14 2020-02-27 84.14 84.14 16896 84.14 14:58 2
5758 84.14 2020-02-27 84.14 84.14 0 84.14 14:59 0
5759 84.09 2020-02-27 84.09 84.09 7182208 84.09 15:00 854
order = ['date', 'time', 'open', 'high', 'low', 'close', 'volume', 'money']
#
df = df[order]
print(df)
date time open high low close volume money
0 2020-01-02 09:31 66.01 66.48 65.85 66.48 866 5722474
1 2020-01-02 09:32 66.22 66.48 66.18 66.30 399 2646681
2 2020-01-02 09:33 66.17 66.39 66.16 66.37 193 1279115
3 2020-01-02 09:34 66.39 66.45 66.37 66.45 622 4130439
4 2020-01-02 09:35 66.45 66.48 66.28 66.28 324 2149783
... ... ... ... ... ... ... ... ...
5755 2020-02-27 14:56 84.12 84.22 84.12 84.17 366 3081344
5756 2020-02-27 14:57 84.17 84.19 84.14 84.17 269 2263360
5757 2020-02-27 14:58 84.14 84.14 84.14 84.14 2 16896
5758 2020-02-27 14:59 84.14 84.14 84.14 84.14 0 0
5759 2020-02-27 15:00 84.09 84.09 84.09 84.09 854 7182208
これでカラム名のソートが完了します
列名の変更
設定されたカラム名が不適切な場合、フォーマットが一致しない場合があります.次の方法で各カラムのカラム名を直接変更できます.
import pandas as pd
df = pd.read_csv('123.csv',header = 0)
df.columns =['date', 'timetemp', 'open', 'high', 'low', 'close', 'volume', 'money']
print(df)
行のソート
ある列の値に従ってDataframeに対して行の並べ替えを行って自分の望む並べ替えの順序を得ることができます
import pandas as pd
frame = pd.read_csv('321.csv',header = 0)
frame = frame.sort_values('date')
frame.reset_index(drop=True, inplace=True)