Windowsの下でPythonの中国語のコードの問題

773 ワード

OS Windows 7 Enterprise
システム言語English(US)
問題の説明
PythonのPandasライブラリを使用してcsvドキュメントを出力場合は、通常通りpdを設定.DataFrame.to_csv(path,index=False,encoding='utf-8')の結果、csvドキュメントを再び開くと、中の中国語が文字化けしていることがわかりました.しかしpandasで読み取る場合は問題なく、自分で開けて文字化けして見るだけです.
ソリューション1:
encodingを'utf_に設定8_sig」.この符号化は「utf-8」よりも広い範囲に含まれる.
ソリューション2:
to_csvをto_に変更Excel、xlsxフォーマットを使用します.同様、読み出し時、read_csvもread_に変更excel
ファイル符号化フォーマットの検出方法を添付
一、Notepad++の中の「コードフォーマット」を使って直接見ることもできるし、トランスコードすることもできる
二、Pythonのchardetライブラリを使用できる
import chardet #  
 
f = open('new 2.txt','rb') #    
for i in f: #    ,      ,        
    a = chardet.detect(i)
    print(a)
f.close()

リファレンスリンク
[1] https://www.zhihu.com/question/34201726