ファイルIO操作符号化問題について

870 ワード

先日問題をもらいました
要求は1つのファイルにあるべきデータを何らかの要求に従って抽出することである.
そこで私はこの問題を持っていました
 1 open('xxx','rb') 
結果は明らかだ
文字化けして出てくる
この時私は仕事を止めて資料を探すしかありません.
もちろん
1 # -*- coding: UTF-8 -*-

きっと忘れないよ
結果を試してみる
文字化けして
pythonのcodecモジュールについて
 1 codec.open('XXX','rb','xx') 
明らかに最初のXXXはファイル名です
3番目のxxは符号化方式である
対応するファイルをunicodeモードに変更します
それを判定する必要がある場合は
 1 str(XXX) 
この方式ですが、ご注意ください.
 1 messages_row[1].encode('utf8') 
これでは現れない
 1 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 0: ordinal not in range(128) 
unicode形式の中国語の文字列を直接間違えると
転載先:https://www.cnblogs.com/xiaoYYprocess/p/6738877.html