LINE Developer Day 2017 "The Technologies in Clova" 講演最速レポート


日時と内容:
LINE Developer Day 2017
http://linedevday.linecorp.com/jp/2017/
渋谷ヒカリエ9Fホール
11:00 - 11:40
The Technologies in Clova
橋本泰一 Data Labs / Clova Center

参加者が多い場合は抽選ということでしたが、個人応募で当選したので、会社には半休の欠勤届けを出してきました。
今は午前のセッションが終わったところでランチタイム休憩中、会場に居残りして書いています。
スマホの電池が切れましたので、一切の写真なしでアップします。
妙に寒いのでアーセナルのウィンドブレーカを着ております。

1. デモ 8/31のw杯予選で浅野が得点した後ののハーフタイムに放映したCM

パパと娘。部屋のあかりをつけたり、ママにCLOVAからLINEでメッセージを送ったり、パパが娘の世話をしながらサッカーの結果を気にしてCLOVAに聞いたり、娘が、「CLOVA、パパ寝ちゃったよってママにラインして」と命令

  • こ、これは、娘の声を話者認識している?
  • ネイティブの日本語でもちゃんと言語として解釈してくれる
  • CMとは関係ないが浅野の名前を出したあたりがアーセナルファンにポイント高い

2. Clova のアーキテクチャ

  • WAVE - (amazonだと echoにあたる)smart speaker
  • CLOVA - (amazonだと Alexaにあたる)AI platform

CLIENT - [CIC] - BRAIN - [CEK] - SKILL
の構成。

コンポーネント

  • CLIENT
    • WAVEとかスマホアプリとか
  • BRAIN
    • 言語解析、スキル呼び出し
  • SKILL
    • 音楽を鳴らすSKillとか、Newsを読む、Lineを送る、灯をつけるなど

インターフェイス

  • CIC (Clova Interface Connect)

    • Speech recognition
    • speech syntesis
    • Natural language understanding
    • など
  • CEK (Clova Extention Kit)

    • LINE
    • LINE Music
    • など

例)
・「秋にあう音楽をかけて」=秋、合う、音楽、を認識して、自動的に音楽を鳴らすSkillを呼び出して、選んだ楽曲をかける
・「この曲は何?」=現在流している曲のタイトルや歌っている人が知りたいという解釈を行い、
曲のメタ情報をCEKに渡し検索して、曲名を答える

3. 課題

  • 固有名詞の言語理解がまだ不十分
    • 音楽、場所、観光地、コンテンツ、アニメ、ドラマ、etcに対応予定
    • 日時や数字や慣用句の読み方に対応予定
    • かなり登録はしているが、まだまだとのこと
    • (これはAlexa Skillでは、Built-in-intentsの部分かな。)

-> Custom SlotTypeに当たる部分はCLOVAではデベロッパーが登録できるようにしないんだろうか?趣味の固有名詞とかはユーザーが登録した方が爆発的に広がると思うんだが。

  • 日本語の問題
    • 強く発音しない子音
    • 同音異語
    • オンとクンの読み間違い、
    • アルファベットを日本語読みできない SEKAI NO OWARI
    • これらをカバーしようとして頑張ってる

4.感想

Alexa skillsとの違いでおおっと思ったもの

  • 日本語の読み方や慣用句に幅広く対応してくれそう。期待
  • 音声からの話者認識ができるようにするとのこと。期待。
    • (話者の認識はAlexaでも以前噂はあったがその後途絶えている。)
  • LINEのクマとかのキャラ筐体がでるということだが、安定感がない。棚と棚の隙間におく感じだろうか。 

その他

  • 秋に一般発売開始だそうです。
  • 最後まで聞いてアンケートに答えた人の中から50人にCLovaをプレゼントだそうだが、 欲しいけど 最後まで聞けない・・ ぐぬぬ・・
  • Skillの開発するから、一個くれさい!

改訂履歴

変換ミスがありましたので修正しました。「公演」→「講演」
日本語の熟語の変換は本当に難しいな。。