小呆学データ分析-pandasのpivotを用いてデータ再構築を行う

3690 ワード

データ再構築の適用シーン

小呆は小瓜について株を売っていて、毎回の操作はすべて詳しい記録を行って、数ヶ月で小呆は自分の株を買う収益と株を売る技巧を見たいと思って、そこで小呆はまず普段の記録を開けて、状況を見ました:stock.csv
date,item,stock1,stock2
2018-03-31,buy into,2710.,1669.
2018-03-31,sell,2708.,1826.
2018-06-30,buy into,2686.,1806
2018-06-30,sell,2700.,1820.
2018-09-30,buy into,2695.,1810.
2018-09-30,sell,1680.,1800.

ぼんやりpythonを開いてコードを書きます
import pandas as pd
stk = pd.read_csv('stock.csv') 
print(stk)

結果とstock.csvの内容は同じで、正しい以上、今すぐ少し変化しましょう.今回は自信満々で、彼はどうすればいいか知っています.前回メロンが階層化インデックスを言ったとき、処理前に並べ替えると言ったデータがたくさんあったので、今回ももちろんデータの並べ替えに使いました.
呆ちゃんはまずdateとitemをインデックスにしようとコードを書きました
stk2 = stk.set_index(['date', 'item'])

結果は次のとおりです.
                     stock1  stock2
date       item                    
2018-03-31 buy into  2710.0  1669.0
           sell      2708.0  1826.0
2018-06-30 buy into  2686.0  1806.0
           sell      2700.0  1820.0
2018-09-30 buy into  2695.0  1810.0
           sell      1680.0  1800.0

ぼうっとしてその日の処理の妹の成绩のまとめの方法を思い出して、その技术を使うことができて、そこでコードを书きます
print(stk2.unstack())

結果は次のとおりです.
             stock1                  stock2               
item      buy into    sell   buy into     sell
date                                                      
2018-03-31   2710.0  2708.0   1669.0   1826.0
2018-06-30   2686.0  2700.0   1806.0   1820.0
2018-09-30   2695.0  1680.0   1810.0   1800.0

この时、瓜ちゃんが来てコードを见て、いつもぼんやりしていると言って、そんなに面倒ではありません.この操作はpivotでいいです.
print(stk.pivot('date', 'item'))

結果もそうでした.なるほど.いずれにしてもボケはこの表を見て、自分がstock 1に投資して損をしたことに気づいて、stock 2に投資して利益を得て、総じてお金を稼いだのです.呆然とうなずいて微笑んだ.
文章ガイドリスト:機械学習
  • 小瓜講機械学習——分類アルゴリズム(一)logistic regression(論理回帰)アルゴリズム原理詳細解
  • 小瓜講機械学習——分類アルゴリズム(二)サポートベクトルマシン(SVM)アルゴリズム原理詳細
  • 小瓜講機械学習——分類アルゴリズム(三)素朴ベイズ法(naive Bayes)
  • 継続
  • データ解析
  • 小呆学データ分析-pandasのmerge関数を使用してデータセットを統合する
  • 小呆学データ分析-pandasのconcat関数を使用してデータセットスタック
  • を行う
  • 小呆学データ分析-pandasの階層化インデックス
  • 小呆学データ分析-pandasのpivotを用いてデータ再構築
  • を行った.
  • 小呆学データ分析-duplicated/drop_duplicatesメソッドによる繰返し処理
  • 小呆学データ分析——欠失値処理(一)
  • 小呆学データ分析——異常値判定と処理(一)
  • 小瓜講データ分析——データ洗浄
  • データの表示
  • メロンデータ分析-データ可視化エンジニアリング(matplotlibライブラリ使用基礎編)
  • メロン講matplotlibプレミアム編-座標軸設定(座標軸中央、座標軸矢印、目盛り設定、標識設定)