enebularで社畜感あふれるAlexaスキルを作った話


これを書いている時点で、12/24。クリスマスイブでございます。
本来は12/20の枠なのにだいぶ遅くなってしまい、申し訳ありませんでした!
ジャンピング土下座!!

enebularとの出会い

LINEのテクニカルエバンジェリスト立花さんから突然、丸山さんと私に女子会運営のお誘いがあり、
さらに「スキル作成はenebularを使ってノンプログラミングでやりましょう」と。
そこで立花さんが召喚したのがenebularマスターの田中さんでした。

9月のイベントで田中&丸山両氏がやってたように、httpsでJsonの受け渡しができるRestAPIが作れるなら、Alexaスキルも作れるのではないかと考え、LT資料 p.19〜のようにチャレンジしたのですが、うまく行かず。。

ぐぬぬ。。
今日はこれをリベンジしたいと思います。(^o^)

結論:Alexaスキル、出来た!

田中さんからもらったClovaスキルハンズオンの資料
https://blog.enebular.com/line/line-cek-meets-enebular/
こちらからenebularのflowをforkし、Alexa用にちょこちょこっと書き換えたら、できました(^o^)

作ったもの

「元気ですか?」と聞くと「元気です」と答えるAlexaスキル。

  • セッションの引き回し
  • カスタムスロットからの発話取り出し

も、やってます。(^o^)

システム構成

開発環境:

  • Mac book air
  • chrome
  • enebular

プロダクト環境:
Amazon Echo <---> Alexa <---> HEROKU

動くデモ

ものすごく真面目にやった結果、なぜか、ブラック企業の社畜コントのようになってしまいました。

作りかた

1. Alexa developerサイトでスキル新規登録

  • スキル名:(なんでも良い)
  • 呼び出し名:なんでも良いですが、「サンプルのツール」にしました。
  • カスタムスロット:GenkiSlot
  • カスタムスロットの値:元気、げんき
  • カスタムインテント:GenkiIntent
  • カスタムインテントのサンプル発話:
    • {GenkiSlot}
    • {GenkiSlot} ですか
    • {GenkiSlot} かな
  • インタフェース: 最初は空。あとで、Enebularのプロジェクトをデプロイ後に発行されるHEROKUのURLを記入。

2. enebular フローつくる

Alexaスキル・フロー図(クリックで拡大)

同じものをDiscoverに置いたので、よろしければImportして使ってみてください。
https://enebular.com/discover/flow/4d5a35ad-72d0-4823-8179-91cb7db0fb8c

3. enebular フロー、書き換え

田中マスターのClovaスキルサンプルに対して、Alexa向けに書き換えをしました。
clovaスキルと、若干文法が違いますのと、セッションの引き回しを追加しました。
ノードごとに詳しく書いていきます。

ノード名は、「Alexaスキル・フロー図」に対応しております。m(_ _)m

httpレスポンスノード「POST」

URL: /clova

URL: /

 functionノード 「LaunchRequestセリフ」

Alexaの文法にあわせてかきなおし。

msg.payload =
{
  "version": "1.0",
  "sessionAttributes": {
    "count": 1
  },
  "response": {
    "outputSpeech": {
      "type": "PlainText",
      "text": "今日は新しいことを学ぶチャンスが訪れるでしょう。 それをやり通せば可能性は無限です。"
    },
    "card": {
      "type": "Simple",
      "title": "カードです",
      "content": "今日は新しいことを学ぶチャンスが訪れるでしょう。 それをやり通せば可能性は無限です。"
    },
    "reprompt": {
      "outputSpeech": {
        "type": "PlainText",
        "text": "他にも質問はありますか?"
      }
    },
    "shouldEndSession": false
  }
}
return msg;

参考) Alexa公式のJson応答例
https://developer.amazon.com/ja/docs/custom-skills/request-and-response-json-reference.html#standard-response-to-launchrequest-or-intentrequest-example

switchノード 「Slots有無」

プロパティ:
payload.request.intent.slots.Genki

payload.request.intent.slots.GenkiSlot を指定

プロパティの条件分岐は、以下のようになります。

「全ての条件を適用」になっている場合は、
「最初に合致した条件で終了」に切り替えておきます。

switchノード「slots.Genki判定」

はい、ここはポイントです。

プロパティに「payload.request.intent.slots.GenkiSlot.value」を指定すると、カスタムスロットから発話を取り出すことができるんですねー!すてき(^o^)

プロパティ:
payload.request.intent.slots.GenkiSlot["value"]
を指定します。

→ 1 :functionノード「発言がぬるぽでした」
→ 2 :switchノード「session attributes count判定」
→ 3 :functionノード「元気以外はききとれません」

最初3をつけてなかったので、Alexaスキルがタイムアウトをしてしまいました。
Slotの値が特定の単語以外だった場合の受け皿として設ける必要があります。

※このプロパティを応用すると、Alexa developerサイトのほうで、カスタムスロットに「蠍座、射手座、」のように何種類かをセットしておけば、それを拾って会話の分岐ができます。夢が膨らみまくりんぐ!

function ノード「発言がぬるぽでした」

// GenkIntentに入ったが、GenkiSlot=null
// 「ぬるぽです」と返す
msg.payload =
{
  "version": "1.0",
  "sessionAttributes": {
    "count": 1
  },
  "response": {
    "outputSpeech": {
      "type": "PlainText",
      "text": "発言がぬるぽでした。もういちどおねがいします。"
    },
    "card": {
      "type": "Simple",
      "title": "GenkIntentに入ったけど、GenkiSlot=nullですぜって表示される",
      "content": "発言がぬるぽでした。もういちどおねがいします。"
    },
    "reprompt": {
      "outputSpeech": {
        "type": "PlainText",
        "text": "他にも質問はありますか?"
      }
    },
    "shouldEndSession": false
  }
}
return msg;

switchノード 「session attributes count判定」

session attributesから、countを取得して、今何回めかを判定します。
このように、コードを書かなくてもセッションから値を取り出せるのは、ありがたいです(^p^)
プログラム苦手勢もこれならハードルが下がるのでは!(^o^)

これだけですよ。。ちょっと信じられないです。
いままでなんだったんだ・・
書くのも楽だし可視化されるのありがたいですよね・・

ちなみにこのcountの値は、セリフのFunctionの中でセットしています。
上の「LaunchRequestセリフ」だと、4行目〜6行目です。

  "sessionAttributes": {
    "count": 1
  },

function ノード「元気以外はききとれません」

冒頭のデモ動画に出てくるセリフです。
アレクサがブラック企業の鬼上司、私が社畜のようになっておりました。(^^;)

// GenkIntentに入ったが、GenkiSlot=「元気」以外の場合、
// 「元気以外はききとれません」と返す
msg.payload =
{
  "version": "1.0",
  "sessionAttributes": {
    "count": 1
  },
  "response": {
    "outputSpeech": {
      "type": "PlainText",
      "text": "元気以外はききとれません。もういちどおねがいします。"
    },
    "card": {
      "type": "Simple",
      "title": "GenkIntentに入ったけど、GenkiSlot=「元気」以外ですぜって表示される",
      "content": "元気以外はききとれません。もういちどおねがいします。"
    },
    "reprompt": {
      "outputSpeech": {
        "type": "PlainText",
        "text": "他にも質問はありますか?"
      }
    },
    "shouldEndSession": false
  }
}
return msg;

Functionノード「1回目、元気です!返答(ここには来ない)」

受け皿として設けましたが、ロジック上ここへは来ません。ので飛ばします。

Functionノード「n回目です。やたら元気です。と返答」

はい、ここがキモです。

「msg.payload.session.attributes.count」には、
このスキルを呼び出してから「元気です」と繰り返した回数が格納されています。
自然に格納されているわけではなく、このノードの中でカウントアップのロジックを書いて、
"sessionAttributes"にセットし直しています。(★1、★2のところ)

//sessionからcountを取得

var count = msg.payload.session.attributes.count;  //セッションから「元気です」と繰り返した回数を取得
var next = count + 1; //次の呼び出しに向けてカウントアップ(★1)


msg.payload =
{
  "version": "1.0",
  "sessionAttributes": {
    "count": `${next}`  //カウントアップしたものをセット(★2)
  },
  "response": {
    "outputSpeech": {
      "type": "PlainText",
      "text": `${count}`+" 回目です。やたら、元気です。" //「元気です」と繰り返した回数をセリフの中にぶちこむ(★3)
    },
    "card": {
      "type": "Simple",
      "title": "カードここに書く",
      "content": "今日は新しいことを学ぶチャンスが訪れるでしょう。 それをやり通せば可能性は無限です。"
    },
    "reprompt": {
      "outputSpeech": {
        "type": "PlainText",
        "text": "他にも質問はありますか?"
      }
    },
    "shouldEndSession": false
  }
}
return msg;

さらに、セリフのなかに「今何回目か」を喋るようにしました。(★3のところ)

httpノード

これは応答を返す大事なノードです。ですが使い方は簡単で、
ファンクションの後ろに線で繋げるだけでOKでした。

msg.payload

デバッグ用に置いてます。
デモ動画の中で、私が「元気です!」と返答すると、行がぴろぴろっと出てましたが、
このmsg.payloadの働きです。

いろんなところにつけたり剥がしたり。。
console.logが見たい時に使います。
なお、これが貼り付けられるノードは、右側に出力の端子が出てるものです。

4.デプロイ

enebularのコンソールから、Herokuにデプロイします。
そこで払い出されたURLをAlexaスキルのエンドポイントに指定することで、連結できます。

5.デバッグ

Alexa Developerサイトの「テスト」シミュレーターを使って一通りテストをします。

うまくいったら、実機テストもしてみましょう!たのしい!

残課題

AWS Lambdaへデプロイ

enebularは、Deploy時にとても簡単にHerokuにアップできるので、とりあえずそれで大丈夫なんですが、
作ったAlexaスキルを一般公開する場合は、AWS Lambdaにアップしておきたいです。
これはIAMの作成が必要なんで、またの機会に。

感想

これはやばいです。

つくってて圧倒的に楽しかったです。

スマートホーム向けNode-red対応のAlexaスキルとは違って、
会話型のスキルをnode-redで書くという奇特な人がいないのか、ググっても説明がでてこず、
また、残念ながら、node-red-contrib-alexaの一連のノードがうまく動かず、
基本的なhttpとfunctionでやってしまいましたが、それでも十分でした。

フローが可視化できるのは大変便利ですね。
AWS Lambdaにも対応しているということですし、サーバーサイドのnode-redも有りだな..と思った次第です。

いずれプログラマという職種は、こういうフローの、ファンクションブロックの中のコードを書く人、
そしてそれを共通化して売るという商売になるのかもしれません。
enebularとかtwillioとか、プラットフォームが違っても、言語が同じなら使いまわせると思うので。
あっ、そうなったら、コード公開は義務付けられるだろうから、商売にはならんでしょうね。
人類の進歩に拍車がかかるなぁ〜(^o^)

その時に私はどのような関数を書けるかしら。
技を磨いておきたいと思います。

以上っす!