ファイルIO操作符号化問題について
870 ワード
先日問題をもらいました
要求は1つのファイルにあるべきデータを何らかの要求に従って抽出することである.
そこで私はこの問題を持っていました
1 open('xxx','rb')
結果は明らかだ
文字化けして出てくる
この時私は仕事を止めて資料を探すしかありません.
もちろん
きっと忘れないよ
結果を試してみる
文字化けして
pythonのcodecモジュールについて
1 codec.open('XXX','rb','xx')
明らかに最初のXXXはファイル名です
3番目のxxは符号化方式である
対応するファイルをunicodeモードに変更します
それを判定する必要がある場合は
1 str(XXX)
この方式ですが、ご注意ください.
1 messages_row[1].encode('utf8')
これでは現れない
1 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 0: ordinal not in range(128)
unicode形式の中国語の文字列を直接間違えると
転載先:https://www.cnblogs.com/xiaoYYprocess/p/6738877.html
要求は1つのファイルにあるべきデータを何らかの要求に従って抽出することである.
そこで私はこの問題を持っていました
1 open('xxx','rb')
結果は明らかだ
文字化けして出てくる
この時私は仕事を止めて資料を探すしかありません.
もちろん
1 # -*- coding: UTF-8 -*-
きっと忘れないよ
結果を試してみる
文字化けして
pythonのcodecモジュールについて
1 codec.open('XXX','rb','xx')
明らかに最初のXXXはファイル名です
3番目のxxは符号化方式である
対応するファイルをunicodeモードに変更します
それを判定する必要がある場合は
1 str(XXX)
この方式ですが、ご注意ください.
1 messages_row[1].encode('utf8')
これでは現れない
1 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 0: ordinal not in range(128)
unicode形式の中国語の文字列を直接間違えると
転載先:https://www.cnblogs.com/xiaoYYprocess/p/6738877.html