日本語で絵文字入力するための IME 追加辞書を公開しました


概要 - Overview

この辞書を Google日本語入力・ATOK・Microsoft IME などに導入することで、 GitHub, Slack, Qiita のようにコロン : をトリガーとして IME でも絵文字を入力することができるようになります。

GitHub, Slack, Qiita 以外のアプリケーションでも GitHub, Slack, Qiita のように絵文字を入力したい」 という要望に応えるための IME 追加辞書です。

ちなみに GitHub や Qiita は英語で絵文字を探す必要がありますが、この辞書を利用することで GitHub や Qiita でも Slack のように日本語で絵文字を入力することができるようになります。

GitHub に MIT License で公開しており、現在は 8264 ペアの絵文字とその読みが収録されています。

👇辞書はこのリンク先から入手できます。

macOS を利用されている方へ
macOS は control + command + space で「文字ビュアー(Character Viewer)」を呼び出すことができるので、この辞書を導入する前にそちらの利用を検討してください。一方で、「システム言語が英語だけど日本語で絵文字を検索したい」という方にはこの辞書がおすすめです。

変換例 - Examples

8264 ペアのごく一部ですが日本語での絵文字入力の例を紹介します。

  • :にっぽん を 🇯🇵 に変換することができるようになります。
  • 🐶 を入力するには以下の方法があります。
    • :いぬ, :いぬのかお, :かお, :どうぶつ, :ぺっと
  • :ぺっと は以下の変換候補を持ちます。
    • 🐇・🐈・🐕・🐩・🐰・🐱・🐶・🐹

以下の形式のテキストファイルで配布しています。

:あいす  🍦    記号
:あいす  🍧    記号
:あいす  🍨    記号
:あいすくりーむ  🍨    記号
:あいすすけーと  ⛸ 記号
:あいすほっけー  🏒    記号
:あいすらんど 🇮🇸    記号
:あいでぃー    🆔    記号
:あいらぶゆー 🤟    記号
:あいるらんど 🇮🇪    記号
:あうたー   🧥    記号

GitHub 上から辞書の中身を閲覧・検索できます。

辞書の導入方法 - Installation

上のリンク先から emoji.zip をダウンロード・解凍すると emoji.txt が得られるので、このテキストファイルをお使いの IME にインポートしてください。

Google 日本語入力

  1. emoji.zip を解凍して emoji.txt を得る
  2. Google日本語入力の 辞書ツール を開く
  3. 管理 をクリック
  4. 新規辞書にインポート をクリック
  5. ファイルを選択 から emoji.txt を選択
  6. お好きな 辞書名 をつける
  7. インポート をクリック

Microsoft IME

emoji.windows.zip を解凍して得られる emoji.windows.txt をインポートしてください。

ATOK

ATOK は元々の機能として「日本語での絵文字入力」が可能ですが、この IME 追加辞書を導入することで表現力を拡張することができます。

導入方法は README.md をご確認ください。

更新履歴

関連プロジェクト - Related project

上記のような日本語 IME での英語入力を支援するための辞書も管理しています。

作者 - Author

何かあれば Issue を立ててください。

「Qiita いいね 」や「GitHub Star 」をいただけると励みになります。

謝辞 - Acknowledgement

辞書はこのデータセットから生成しました。この素晴らしい絵文字プロジェクトを紹介したい思いがあり、実用例として今回の IME 絵文字辞書を公開しています。

emoji_ja は、Unicode に登録されている絵文字に対して、日本語の読みやキーワード、分類を付与したデータセットです。Unicode で定められている名称やアノテーションを元に構築しています。

データセットは以下の形式の json ファイルです。

"🐶": {
        "keywords": [
            "イヌ",
            "イヌの顔",
            "ペット",
            "動物",
            "犬",
            "顔"
        ],
        "short_name": "イヌの顔",
        "group": "動物と自然",
        "subgroup": "動物 哺乳類"
    },

生成した絵文字辞書では keywordsshort_name の一つずつに絵文字を対応させたものを収録しています。

emoji_ja データセットは自然言語処理において、絵文字に意味を持たせたり、感情分析などに利用できると思います。

記事は以上です。
この絵文字辞書を活用して快適な絵文字ライフをお過ごしください👍