「ランチ合コン探偵」をmecabで分析したけどうまくいかない話
Motive
テイコウペンギンを見てたら、テレビドラマのコラボをしていた。
何、だと、、、
山本美月とトリンドル玲奈が出演している、、、だと。
タイトルは
ランチ合コン探偵!!!
内容は
対照的なOLコンビが
ランチタイムに開かれる合コンの場で
謎解き×彼氏探しを繰り広げる!
合コンも、謎解きも、ランチタイム一本勝負‼
とのこと。
なるほど、何言っているかわからない。
てか、「ランチ合コン探偵」は単語を雑に3つ並べているだけじゃねーかと最初はブーたれてましたが、
よくよく考えると、「いつもランチで合コンしている探偵」と少し文章化すると ランチ -> 合コン -> 探偵
or ランチ -> [合コン探偵]
と何らかの係り結びするのではないかと思たとです。
「ランチ合コン探偵」はmecabではどのように形態素分析するか調べてみたとです。
Run
まず、mecabをインストール。
brew install mecab
で、実行
mecab
ランチ合コン探偵
ランチ 名詞,一般,*,*,*,*,ランチ,ランチ,ランチ
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
このままだと、単語を区切る場所や品詞のパターンは一回しか出力されないです。
そのため -N3
をつけるとその分のパターンを出力することができます。(Nは最大512)
別の例として、「日本テレビ東京」で出力してみる。
「日本」「テレビ」「東京」と3つの単語が並んでいるが、「東京にある日本テレビ」or「日本にあるテレビ東京」みたいなのが出力されるのが良さげです。
mecab -N3
日本テレビ東京
日本テレビ 名詞,固有名詞,組織,*,*,*,日本テレビ,ニホンテレビ,ニホンテレビ
東京 名詞,固有名詞,地域,一般,*,*,東京,トウキョウ,トーキョー
EOS
日本 名詞,固有名詞,地域,国,*,*,日本,ニッポン,ニッポン
テレビ東京 名詞,固有名詞,組織,*,*,*,テレビ東京,テレビトウキョウ,テレビトーキョー
EOS
日本 名詞,固有名詞,地域,国,*,*,日本,ニッポン,ニッポン
テレビ 名詞,一般,*,*,*,*,テレビ,テレビ,テレビ
東京 名詞,固有名詞,地域,一般,*,*,東京,トウキョウ,トーキョー
EOS
それっぽい物が出力されました!
では「ランチ合コン探偵」はどうか
mecab -N10
ランチ合コン探偵
ランチ 名詞,一般,*,*,*,*,ランチ,ランチ,ランチ
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,一般,*,*,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,固有名詞,組織,*,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,固有名詞,一般,*,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,一般,*,*,*,*,ランチ,ランチ,ランチ
合 名詞,一般,*,*,*,*,合,ゴウ,ゴー
コン 名詞,一般,*,*,*,*,コン,コン,コン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,一般,*,*,*,*,ランチ,ランチ,ランチ
合 名詞,接尾,助数詞,*,*,*,合,ゴウ,ゴー
コン 名詞,一般,*,*,*,*,コン,コン,コン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,固有名詞,地域,一般,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,固有名詞,人名,一般,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 感動詞,*,*,*,*,*,*
合コン 名詞,一般,*,*,*,*,合コン,ゴウコン,ゴーコン
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ランチ 名詞,一般,*,*,*,*,ランチ,ランチ,ランチ
合 名詞,一般,*,*,*,*,合,ゴウ,ゴー
コン 名詞,一般,*,*,*,*,*
探偵 名詞,サ変接続,*,*,*,*,探偵,タンテイ,タンテイ
EOS
ほぼほぼ、分割された単語は名詞にしか分類されないです。
「日本テレビ東京」もそうなんですが今の技術では名詞同士で係り結びするのは難しそうです。
If English?
英語にするとどうなるのか。
このドラマ自体はランチ探偵の小説を題材にしているのですが、英文はシンブルにlunch detective
でした。合コンが余計に盛っているので面倒です。
最初は lunch meeting detective
かと思ったのですが、ビジネスライクな感じでちょっと違う。
合コンを英語にするとjoint party
なので「ランチパーティに参加している探偵たち」と考えるとthe detectives joining lunch party
でいいかな。 hunting要素がなくて無味無臭なのが少し残念
Future
日本語も英語もそうなんですが、係り結びを意識した文章 -> 単語の並び
or単語の並び -> 文章
の変換が難しく、多くの似ているデータを集めて機械学習しないとノーヒントでは厳しいかもです。
Reference
Author And Source
この問題について(「ランチ合コン探偵」をmecabで分析したけどうまくいかない話), 我々は、より多くの情報をここで見つけました https://qiita.com/satsukiya/items/b63d9d592684f9f330b2著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .