Python3で漢字の文字コードを取得する
漢字の文字コードが知りたくなる時、皆さんありますよね。文字コードなんてネットで検索すればもちろんいくらでも出てくる情報ですが、今回はPython3上で漢字の文字からUnicode, Shift_JIS, EUC-JP, JISコード (iso-2022-jp), Big5の各文字コードを取得する方法です。例として漢字の「一」に対応する文字コードを取り出します。
Python3
print("Unicode: {}".format(
hex(ord("一"))[2:].upper()
))
# Unicode: 4E00
print("Shift_JIS: {}".format(
hex(int.from_bytes("一".encode("shift_jis"), "big"))[2:].upper()
))
# Shift_JIS: 88EA
print("EUC-JP: {}".format(
hex(int.from_bytes("一".encode("euc-jp"), "big"))[2:].upper()
))
# EUC-JP: B0EC
print("JISコード (iso-2022-jp): {}".format(
(hex("一".encode("iso-2022-jp")[3])[2:]+hex("一".encode("iso-2022-jp")[4])[2:]).upper()
))
# JISコード (iso-2022-jp): 306C
print("Big5: {}".format(
"".join([hex(x)[2:] for x in "一".encode("big5")]).upper()
))
# Big5: A440
環境に依存する可能性がありますが、Ideone.comで正しく動くことを確認しました( https://ideone.com/PEeAdx )。
Author And Source
この問題について(Python3で漢字の文字コードを取得する), 我々は、より多くの情報をここで見つけました https://qiita.com/o_kn/items/0c9db13b994af3a1b29b著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .