文中の人名をイニシャルに変換して匿名化をはかる


皆さん、ネット上で実名を使ってますか?facebookなど実名ベースでのサービスが当たり前になったとはいえ、気軽に実名のやり取りをするのはちょっと怖さがありますよね。本名を知られると魂を吸い取られると頑なに信じている古いタイプのネット民にとって、息苦しい世の中になりましたね。

・・・という訳で、文中の人名をイニシャルに変換して匿名化をはかるコマンド、anonyをGo言語で作ってみました。

筒井康隆は、日本の小説家・劇作家・俳優である。ホリプロ所属。身長166cm。小松左京、星新一と並んで「SF御三家」とも称される。パロディやスラップスティックな笑いを得意とし、初期にはナンセンスなSF作品を多数発表。1970年代よりメタフィクションの手法を用いた前衛的な作品が増え、エンターテインメントや純文学といった境界を越える実験作を多数発表している。

こんな感じのテキストファイルをanonyに渡せば・・・

$ anony test.txt

人名をイニシャルに変換します。

T・Yは、日本の小説家・劇作家・俳優である。ホリプロ所属。身長166cm。K・S、H・Sと並んで「SF御三家」とも称される。パロディやスラップスティックな笑いを得意とし、初期にはナンセンスなSF作品を多数発表。1970年代よりメタフィクションの手法を用いた前衛的な作品が増え、エンターテインメントや純文学といった境界を越える実験作を多数発表している。

あぁ、なんだか「ギョーカイの事情通」っぽい!ほとばしるゴシップの香り・・・

 

ではこれは誰でしょう?

$ anony IH.txt

I・Hは、日本のお笑いタレント、ラジオパーソナリティ、元落語家。本名、S・K。旧姓、T。男性。 東京都荒川区西尾久出身。文京区在住。星企画、フリーを経て、ホリプロ所属。 身長183cm。体重125kg。東京都立足立新田高等学校中退。妻は元アイドルのS・M。

Wikipediaを使えばわたしは誰でしょうクイズが量産できますね。

 

小説の一文もイニシャル化できます。

「精神的に向上心のないものは、馬鹿だ」私は二度同じ言葉を繰り返しました。そうして、その言葉がKの上にどう影響するかを見詰めていました。「馬鹿だ」とやがてKが答えました。「僕は馬鹿だ」Kはぴたりとそこへ立ち留どまったまま動きません。彼は地面の上を見詰めています。私は思わずぎょっとしました。

しくみ

以前作った文章からダジャレのみを抜き出すコマンドを作ってみたと同様、kagome形態素解析エンジンを使っています。

形態素解析で文章を分解し、単語が人名だと判定されたら最初の文字をアルファベットに置き換えています。単純ですね。

anonyのGithubリポジトリはこちら

まとめ

押し寄せる実名化の波に飲まれつつあるネットの潮流にささやかな抵抗が果たせました。
世の中ミステリアスなほうがいいのです。

Windows/OSX/Linuxの実行ファイルはこちら
PATHの通ってるところに放り込めばすぐに使えます。

イニシャルトークに花を咲かせましょう。