python解析unicode文字列utf 8符号化文字列
696 ワード
phpで返されるjson文字列は、中国語が含まれている場合、uxx形式のunicode符号化文字列に変換されて返されます.
ブラウザではこのコードを正常に認識できますが、バックグラウンドプログラムでは認識できず、表示されているuxxの文字を直接出力し、トランスコードしていません.
変換方法は次のとおりです.
ブラウザではこのコードを正常に認識できますが、バックグラウンドプログラムでは認識できず、表示されているuxxの文字を直接出力し、トランスコードしていません.
変換方法は次のとおりです.
>>> import json
>>> q = '{"text":"\u4e00\u4ee3\u98ce\u534e\u7684\u7edd\u4e16\u4f73\u4eba"}'
>>> print q
{"text":"\u4e00\u4ee3\u98ce\u534e\u7684\u7edd\u4e16\u4f73\u4eba"}
>>> obj = json.loads(q)
>>> print obj
{u'text': u'\u4e00\u4ee3\u98ce\u534e\u7684\u7edd\u4e16\u4f73\u4eba'}
>>> print obj['text']
>>>