pandas excelデータ処理経験


1.excelファイル名、またはワークブックに中国語文字を含めることはできません.含めると、読み込み時にIOエラーが表示されます.カラム名は中国語文字をサポートできるようです.
解決策は、ネットユーザーが似たような問題に直面し、「csvファイルには多くの中国語があり、pandasにどのように表示されますか?」主に復号符号化の問題である.
 :
pd.read_csv("example.csv",encoding="gb2312") :import pandas as pddf = pd.read_csv("example.csv",encoding="gb2312")    pandas , , encoding = ‘gb18030’   。
python       #-*- coding=utf-8 -*-  pd.read_csv(csvname,encoding="gb2312") python ,  notepad++ , utf-8  BOM 。  liunx window

解決できませんでしたが、中国語のカラム名でインデックスできませんでした.
2.カラム名は中国語が正常に表示されているが、中国語のカラム名でインデックスしようとしたときもエラーが発生した.-KeyError、関数getitem(self,key)は正常に動作しない.
c:\python27\lib\site-packages\pandas\core\frame.pyc in __getitem__(self, key)
   1995             return self._getitem_multilevel(key)
   1996         else:
-> 1997             return self._getitem_column(key)
   1998
   1999     def _getitem_column(self, key):


中国語の文字はKeyとしては使えないようです.時間をかけてgetitem(self,key)関数を修正すればこの問題を解決できるはずだ.どうせ英語を読んでもかまわない.
3.データ展示では、excelはpandasよりはるかに快適です.EXcelとpandasを組み合わせて、すべてpandasに導入しても、必ずしも効率が著しく向上するとは限らないようです.だから小ロットの导入、pandasのデータ処理机能を利用して、便利な処理が终わった后に、更によくexcelに帰るべきです.例えば農家の非農業業界の従業員の給料を計算するには、10人以上の人を統計する必要があるかもしれません.少なくとも統計式を書くには10人ぐらいかかり、excelに書くのは気持ち悪いので、pandasに導入し、計算が終わったら、結果をexcelに入れなければなりません.計算、描画などのタスクをpandasで完了します.
4.DataFrameデータを表示する場合、Out cellの左側をクリックすると、unscrollまたはscroll DataFrameになります.