UnicodeDecodeError: 'utf8' codec can't decode byte 0xe5 in position 0: unexpected end of data

716 ワード

Pythonの中国語のコードの問題はCoderがよく出会う悩みの問題です
Pythonは一般的にAscii,Unicode符号化を採用しているが,世界各国の言語には中国のgbk,gb 2312など様々な符号化が存在する.
まず、pythonのデフォルトでは、ソースファイルはascii符号化とみなされます.
 
unicodeオブジェクトを使用する場合は、このようにuタグを使用するほか、unicodeクラスや文字列のencodeメソッドやdecodeメソッドを使用することもできます.
unicodeクラスのコンストラクション関数は、文字列パラメータと符号化パラメータを受け入れ、文字列をunicodeにカプセル化します.たとえば、ここではutf-8符号化を使用しているため、unicodeの符号化パラメータは「utf-8」を使用して文字をunicodeオブジェクトにカプセル化し、コンソールに正しく出力します.
Python 2.7+WIN 10環境:
site='    '
input.send_keys(site) 
   ,    :UnicodeDecodeError: 'utf8' codec can't decode byte 0xe5 in position 0: unexpected end of data

site='    '
s1 = unicode(site, 'utf-8') #  
input.send_keys(s1)