Adobe-Japan1-6およびJIS2004対応の外字チェッカーを作成
日本語EPUBの作成で結構面倒なのが「使える文字と使えない文字のチェック」です。何せ単行本1冊で10万文字くらいはあったりしますので、それを目視でチェックして使えない文字を見分けるなどというのは普通に考えて無理があるわけです。また、例えベテランの作業者なら対処できるとしても、そういう機械的な処理に関しては極力機械に任せて省力化したいところです。ということで自前のチェッカー内に組み込む目的で「Adobe-Japan1-6」および「JIS X 0213:2004(JIS2004)」を対象として外字のチェッカーを作りました。
ターミナルで
perl /ローカルパス/AJ1-6check.pl チェックしたいEPUBファイルのパス
のような形で指定すると、以下のようなチェックログのファイルを出力します。上の例はAdobe-Japan1-6用チェッカーの指定例ですが、JIS2004用チェッカーも使い方は同じです。
普段ならリストを貼って公開するところなのですが、なにせ膨大な文字をリスト化しているためとんでもない長さになるため、ダウンロードリンクを貼る形とします。
なお、Adobe-Japan1-6用のリストは@monokanoさんのご厚意により、テキストエディタ「浮紙」用の特定文字項目ファイル内のリスト(正規表現のパターン)を流用させていただいています。
JIS2004用のものは自前で調べて書きました。しんどかった(笑)。
Mac用のアプリに統合したものはこちら。Epubcheckのバージョンも4.2.2に上がっています。
Author And Source
この問題について(Adobe-Japan1-6およびJIS2004対応の外字チェッカーを作成), 我々は、より多くの情報をここで見つけました https://qiita.com/JunTajima/items/7878687adcc2e0685c47著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .