20190208 DroidKaigi2019

Dialogflowによる自然言語処理 (NLP)を用いたボイスコマンド音声認識の精度向上 DroidKaigi 2019 2019/02/08 10:30-11:00 @Room1 Drivemode, Inc.
KAKKA (Nobuhisa Hirata) @KAKKA_Blog

自己紹介 KAKKA DroidKaigi 2017 音声認識と連続音声認識について DroidKaigi 2018 ActivityRecognitionについて

目次 • ボイスコマンド音声認識の実現方法 ◦ シンプルかつ単一要件の場合 ◦ 複雑または複数要件の場合 • Dialogflow ◦
概要 ◦ 使い方 • 音声認識率改善結果について

ボイスコマンド音声認識の実現方法

シンプルかつ単一要件の場合

シンプルかつ単一要件の場合押す

シンプルかつ単一要件の場合私は押すことができます。ボタン押せるヤツ

シンプルかつ単一要件の場合押してボタン押せるヤツ

シンプルかつ単一要件の場合ピンポーン！ボタン押せるヤツ

シンプルかつ単一要件の場合ボタン押せるヤツ音声認識キーワード辞書押す能力

シンプルかつ単一要件の場合音声認識 SpeechRecognizer recognizer = SpeechRecognizer.createSpeechRecognizer(application); recognizer.setRecognitionListener(new RecognitionListener() { ...
@Override public void onResults(Bundle results) { List<String> recognitionResultList = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); } ... }); recognizer.startListening(new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH));

シンプルかつ単一要件の場合キーワード辞書 String[] dictionary = {"押す", "押せ", "押し", "雄", "推し"};
for (String keyword : dictionary) { if (recognitionResult.contains(keyword)) { return true; } } 押す

シンプルかつ単一要件の場合キーワード辞書 String[] dictionary = {"押す", "押せ", "押し", "雄", "推し"};
for (String keyword : dictionary) { if (recognitionResult.contains(keyword)) { return true; } } 押すアプリ内で完結

複雑または複数要件の場合音楽再生したい注文したい教えてほしい喋りたい案内してほしいメッセージ送りたい電話かけたい

複雑または複数要件の場合私はいろいろできます。いろいろできるヤツ

複雑または複数要件の場合よかろう！いろいろできるヤツ東京駅まで連れてって〜ヘビメタの音楽を再生母に電話かけて Androidって何？

複雑または複数要件の場合いろいろできるヤツ音声認識自然言語処理いろんな実行能力

複雑または複数要件の場合いろいろできるヤツ音声認識自然言語処理いろんな実行能力 Dialogflowを使う

Dialogflow

Dialogflowの概要教師データを用いた学習により、自然言語処理を行う 9時に東京に案内して要件: 案内時間: 9時目的地: 東京

Dialogflowの概要 9時に東京に案内して時間場所学習データ

Dialogflowの概要 9時に東京に案内して時間場所学習データ 10時に岐阜に案内して 10時に岐阜に案内します

Dialogflowの概要いつ、どこに、案内するなかったら今で良いなかったら案内できない。必須パラメータ命令に必要な情報の管理も可能

Dialogflowの概要 9時に東京に案内して学習データ案内してどこに？滋賀県 (今から)滋賀県に案内します必須パラメータ

Dialogflowの使い方

Dialogflowの使い方 Intent Entity Agent 要件を判別パラメータ検出パラメータの種類定義

Intent Entity Agent Dialogflowの使い方

Intentの設定画面 Training phrases Dialogflowの使い方学習させる文章を入力

Dialogflowの使い方検出したいパラメータを定義

必須パラメータにできる Dialogflowの使い方

リスト形式のパラメータにできる Dialogflowの使い方

動作確認 Dialogflowの使い方

Training phrases Dialogflowの使い方

{ "queryText": "amazon musicで陰陽座を再生", "action": "音楽再生", "parameters": { "MusicAppName":
"amazon music", "ArtistName": "陰陽座" }, … } Dialogflowの使い方

Intent リスト形式のパラメータにできる Dialogflowの使い方

{ "queryText": "陰陽座をSpotifyで再生", "action": "音楽再生", "parameters": { "MusicAppName": "Spotify", "ArtistName":
["陰陽座"] }, … } Dialogflowの使い方

Android Dialogflowの使い方 Androidから使うには？

Android SpeechRecognizer “音楽を再生” Dialogflowの使い方

Android SpeechRecognizer “音楽を再生” { "queryText": "音楽を再生", "action": "音楽再生", "parameters": {
"MusicAppName": "", "ArtistName": "" }, … } Dialogflowの使い方

Android AIConfiguration config = new AIConfiguration( DIALOG_FLOW_TOKEN, ai.api.AIConfiguration.SupportedLanguages.English, AIConfiguration.RecognitionEngine.System );
aiDataService = new AIDataService(application, config); AIRequest aiRequest = new AIRequest(); aiRequest.setQuery(recognizedText); aiRequest.setResetContexts(resetContext); AIResponse response = aiDataService.request(aiRequest); Dialogflowの使い方

Android 自社サーバー (1) get token V2 Dialogflowの使い方

Android 自社サーバー (1) get token (2) authentication V2 Dialogflowの使い方

Android 自社サーバー (1) get token (2) authentication (3) return token
V2 Dialogflowの使い方

(4) return token V2 Dialogflowの使い方

(4) return token (5) detect intent V2 Dialogflowの使い方

(4) return token (5) detect intent (6) return result V2 Dialogflowの使い方

Android 自社サーバー (1) detect intent V2 Dialogflowの使い方

Android 自社サーバー (1) detect intent (2) authentication V2 Dialogflowの使い方

Android 自社サーバー (1) detect intent (2) authentication (3) return token
V2 Dialogflowの使い方

(4) detect intent V2 Dialogflowの使い方

(4) detect intent (5) return result V2 Dialogflowの使い方

(4) detect intent (5) return result (6) return result V2 Dialogflowの使い方

Intent Entity Agent Dialogflowの使い方

Entity Intentで検出するパラメータのうち、決まった候補(Entity)の中から検出するために用いる Spotifyでマイケル・ジャクソンを再生 PlayerName MusicArtistName Dialogflowの使い方

Spotifyでマイケル・ジャクソンを再生 PlayerName MusicArtistName Spotify Amazon Music Google Play Music Apple
Music Entity Dialogflowの使い方

Entityの画面 Dialogflowの使い方

Dialogflowの使い方 Intentの画面に戻る

Dialogflowの使い方 Intentの画面に戻る特定のMusicAppNameのみパラメータとして検出

System Entity デフォルトで様々なEntityが定義されている。 Dialogflowの使い方

DestinationEntityを新規作成住所検出 city name検出観光スポット検出 Dialogflowの使い方

Intentの設定画面にもどる Dialogflowの使い方

System Entity Dialogflowの使い方

System Entityにより住所を検出 Dialogflowの使い方

System Entityによって検出されず Dialogflowの使い方

Entityに追加してやる Dialogflowの使い方

DestinationEntityによって検出 Dialogflowの使い方

Entityから消して、Training phrasesに追加すると？ Dialogflowの使い方

Entityから消して、Training phrasesに追加すると？検出されない！という仕様らしい Dialogflowの使い方

Entityに固有名詞をすべて定義するのは難しい Dialogflowの使い方

「スターバックス」のような固有名詞を検出できるSystem Entity はあるのか？ Dialogflowの使い方ない！

System Entity: @sys.any なんでも検出できるEntity Dialogflowの使い方

System Entity: @sys.any Dialogflowの使い方

Dialogflowの使い方

System Entity: @sys.any ↓ なんでも検出できるように Dialogflowの使い方

ボイスコマンド音声認識率の改善

音声認識率の改善 →音声認識部分はAndroidのSpeechReocgnizerに頼る →正しいintent検出の精度を上げる音声認識率の改善

いろいろできるマンは何ができる？私はいろいろできます。いろいろできるヤツ

ユーザーはなんでも聞いてしまういや、無理っす。いろいろできるヤツ日本の将来は？あの娘の好きな人は？俺、実は既婚者なんだトリプルアクセルして 100mを10秒台で走ってコード書いて

自信を持ってできることを明確に私はいろいろできます。いろいろできるヤツナビゲーションと音楽再生と電話発信とメール送信

私はいろいろできます。いろいろできるマンナビゲーションと音楽再生と電話発信とメール送信得意なことをユーザーに伝える自信を持ってできることを明確に

まずは学習データ集め最初はユーザーがなんと命令するかというデータがないので、自分で頑張ってTraining phrasesに定義する。

アノテーション作業

アノテーション作業 DialogflowのTrainingページだとやりづらい自分で解析ツール作るのがいいかも

音声認識の揺れを吸収音楽を再生 “雲鶴を再製” “雲鶴を再製” を学習アノテーション作業においてユーザーの意図を読み取ることが重要

App Launch 音声認識率の改善結果 Navigation Play Music Send Message Place a
Call キーワード辞書マッチングしてた頃 VS Dialogflowで学習させたあと

No match率の変化音声認識率の改善結果 32.6% 17.3%

まとめ(1/2) • ボイスコマンドの要件がシンプルな場合はDialogflowを使うまでもない • ボイスコマンドの要件が複雑な場合、自然言語処理が必要。 Dialogflowを使うと便利 • Dialogflowの基本はIntentとEntity ◦
Intentは要件を判別、パラメータ検出 ◦ Entityはパラメータの種類定義

まとめ(2/2) • ボイスコマンド音声認識率改善のためにDialogflowが活用できる ◦ 予めユーザーにできることを伝える ◦ データ集めからスタート ◦ アノテーション作業は地道にがんばる
◦ 音声認識の揺れを考慮し、本当にユーザーがやりたいことを考えてアノテーション作業を行う

宣伝: Androidエンジニア 1人募集中 • Drivemode, Inc. ◦ 車運転者向けのスマホアプリ提供 ◦ 世界中にユーザーがいるが、アメリカ・ファースト
◦ アーリーステージ（シリーズA）のスタートアップ ◦ シリコンバレーの会社だけど、東京支社もあり ◦ 公用語は英語、英語必須だけどやる気あればOK ◦ 多国籍企業で英語力上がります ◦ サーバーエンジニアも募集中応募方法 →LinkedInかIndeedから応募か、私に連絡！(Twitterでも何でも)

20190208 DroidKaigi2019

20190208 DroidKaigi2019

More Decks by KAKKA

Other Decks in Technology

Featured

Transcript