\uからはじまる謎の符号、Unicodeエスケープシーケンス


個人的メモのようなもの。

curlコマンドで叩くと謎の文字列が返ってくることがある。おぉ、読めない……

curl -sk "http://localhost/api/1/test"
{"message": "\u30ed\u30b0\u30a4\u30f3\u3057\u3066\u304f\u3060\u3055\u3044"}

実際には、 jq を通すことで読める。

curl -sk "http://localhost/api/1/test" | jq
{"message": "ログインしてください"}

この文字はなんなんだろうか、ということで。
調べてみると、正式名称は分からないものの、「Unicodeエスケープシーケンス」という言葉が出てきました。

「ロ」と「30ed」の対応は、何の対応なんだろうか……?

JIS X 0208 (1990) to Unicode 漢字コード表 を参考にさせていただきました。

これを見ると、UTF-16での符号のようです。

Webページでのサービスを見つけました。お手軽で良いかも。

Unicodeエスケープシーケンス変換ツール