Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20200630_tokyobishbash_hylable

Hylable
June 30, 2020

 20200630_tokyobishbash_hylable

Tokyo BISH Bash #2 ( https://tokyo-bish-bash.connpass.com/event/179609/ ) の発表資料です。

Hylable

June 30, 2020
Tweet

Other Decks in Business

Transcript

  1. 自己紹介、の前に会社紹介 ミッション: 音環境分析でコミュニケーションを豊かにする 会社名 ハイラブル株式会社 (Hylable Inc.) 代表 代表取締役:水本武志 博士(情報学)、取締役:菅原哲也

    設立 2016年11月21日 事業内容 メディア信号処理やコミュニケーションに関する商品やサービスの 企画・製品・運用・販売・情報提供・コンサルティング等 ニホンアマガエルの学名 Hyla japonica 接尾辞「可能」 (C) 2020 Hylable Inc.
  2. 自己紹介 ◼安良岡直希 やすらおかなおき ◼ NMF, LPC, ハーモニッククラ スタリングを同時利用した1ch 音楽音響信号分離&分析 ◼

    レトロゲームのバグ動画好き ◼ 子供にminecraftやらせようと して苦戦中 ◼柳楽浩平 なぎらこうへい ◼ ノンパラメトリックベイズに 基づくinfinite ICAによる周波 数領域ブラインド音源分離 ◼ ラジオ好き(特にFM・アニラジ) ◼ 落ち着いたらGo Toキャンペー ンで遠くに行きたい (designed by Michiko Kato) (C) 2020 Hylable Inc.
  3. 発表者2人と代表 が同じ研究室出身 ◼ 京都大学 大学院情報学研究科 音声メディア分野 ◼ テーマは聞き分ける ◼ 3人ともまず大企業に就職。その後起業した代表に声をか

    けられて合流した 複数人同時発話をロボットが聞き分ける http://winnie.kuis.kyoto-u.ac.jp/SIG/ カエルの鳴き声のパターンを見つける (C) 2020 Hylable Inc.
  4. ハイラブルの分析の基本構成 マイクロホンアレイで 目的の会話音声を抽出 誰がいつ話したか? 議論の状態を 定量化・可視化・レポート化 どんなプロセスだったか? 音環境分析 議論分析 環境の雑音

    隣接チーム 対象のテーブルの 会話だけを抽出 A B C D A B C D 時間 いずれも特許取得済 発話量 発話ダイナミクス A B C D ターンテイク 自動レポート (C) 2020 Hylable Inc.
  5. 人材育成のための会話分析の特徴 1 ◼ 人間同士の本来の会話の様子を見たい ◼ 複数グループが一斉に話す ◼ 盛り上がるほど割り込んで話す ◼ 深い話題ほど考えながら不明瞭に話す

    ◼ そもそも話者が子供だったり、etc. ◼ 分析システムに合わせてもらう (ゆっくり明瞭に話す等) と意味がない ⇒ 音声認識が難しい (C) 2020 Hylable Inc.
  6. 人材育成のための会話分析の特徴 2 ◼ 完全な書き起こしがあれば十分、でもない ◼ 単純に量が膨大になる ◼ 内容は理解できるが、 「やり取り」は見づらい ◼

    複数回の比較がしづらい ◼ 細かく様子を知りたいなら 録音音声まで聞きたくなる (C) 2020 Hylable Inc. (テスト用のスクリプト)
  7. 実環境で動くものを作らないと売れない ◼ ターゲットとなる現場 ◼ 準備時間は数分ぐらいしかない ◼ 学習机には電源がない ◼ 学校ごとにIT整備状況が違う(Wi-Fi有無・タブレットの普及など) ◼

    みんなで活発に話している(=SNRが悪い)ほど良い授業 ◼ 「システム側に合わせてもらう」ではダメ 社会人研修でのグループワーク 学校での話し合い授業 (C) 2020 Hylable Inc.
  8. どこでも・簡単に・安定して使ってもらうために ◼ 音声信号処理技術の選定 ◼ 会話の「定量化」に専念 ◼ マイクロホンアレイの利用 ◼ マイクのIoT化 ◼

    システム設計:Webサービス ◼ パブリッククラウドの利用 ◼ マイクロサービス構成 ◼ システム更新の仕組み化・管理コストの削減 どこでも 簡単に 安定して ✅ ✅ ✅ ✅ ✅ ✅ ✅ どこでも 簡単に 安定して ✅ ✅ (C) 2020 Hylable Inc.
  9. 1.会話の「定量化」に専念 ◼ 最近の音源分離・強調は性能いいので認識時に使えば性能上がるのでは? ◼ DNN-basedな手法 / ILRMA / etc... →チューニングなしで実用に耐えうる性能が出ないとユーザは喜ばない

    フェーズ遷移 声の大きさ 発話バランス 盛り上がり いつ話した? 誰が話した? 音環境分析(定量化) ・小学生から大人まで理解しやすい ・言語によらない応用の広がり 音声 音声認識 ・自然会話では性能不十分 ・前後に多くの処理が必要 テキスト よくある質問 (C) 2020 Hylable Inc.
  10. 3.マイクのIoT化 ◼ マイクにハイラブル製のファームウェアを導入 ◼ Raspberry Pi上で動作 ◼ 単体で録音が可能 ◼ 単体でHylable

    Discussionに直接接続 安定した録音環境を実現 ◼ PC接続のマイクデバイス(USBなど)でもいいのでは? ◼ 「なぜかシステムに繋がらないんですけど…?」 ◼ 収録音声の質がばらつく・音声の同期が困難 →環境依存の要因が増えて分析時の性能に影響が出る よくある質問 (C) 2020 Hylable Inc.
  11. どこでも・簡単に・安定して使ってもらうために ◼ 音声信号処理技術の選定 ◼ 会話の「定量化」に専念 ◼ マイクロホンアレイの利用 ◼ マイクのIoT化 ◼

    システム設計:Webサービス ◼ パブリッククラウドの利用 ◼ マイクロサービス構成 ◼ システム更新の仕組み化・管理コストの削減 どこでも 簡単に 安定して ✅ ✅ ✅ ✅ ✅ ✅ ✅ どこでも 簡単に 安定して ✅ ✅ (C) 2020 Hylable Inc.
  12. Vue.js Raspberry Pi クラウド ローカル ユーザ管理 SNS SQS RDS IoT

    Core Amplify API Gateway Cognito EC2 ELB DynamoDB Lambda 分析セッション管理 DynamoDB Lambda AppSync レコーダ操作 DynamoDB Lambda AppSync S3 レポート生成 API Gateway Lambda S3 Hylable Discussion システム構成 分析ワーカー Lambda S3 HARK Route53 Serverless Architected by Tetsuya Sugawara (C) 2020 Hylable Inc.
  13. 1.パブリッククラウド(AWS)の利用 ◼ IoT Core ◼ マイクとクラウドの容易な連携 ◼ 大量のマイクの同時使用も耐える ◼ Lambda

    / Auto Scaling ◼ 必要なときに必要なだけ動かす ◼ マネージドサービスの積極的活用 ◼ 音声処理と直接関係ないがサービス化には必要不可欠 ◼ クラウド側に任せて管理コストを削減 Cognito (アカウント管理) RDS DynamoDB (データベース) Route53 (ルーティング) S3 (ストレージ) SNS (通知サービス) SQS (イベントキュー) IoT Core Hylable Discussion ELB (ロードバランサ) Lambda (サーバレス計算) (C) 2020 Hylable Inc.
  14. 2.マイクロサービス構成 ◼ 技術の適材適所 ◼ 明確な役割分担 ◼ 他システムとの部分連携も可能 ◼ 更新したい部分だけ更新可能 Vue.js

    Raspberry Pi Vuetify (デザインコンポーネント) フロントエンド API(マイクロサービス) マイク(組み込み) Golang GraphQL REST MQTT Node.js 分析ワーカー Python レコーダ操作 ユーザ管理 レポート生成 分析セッション管理 (C) 2020 Hylable Inc.
  15. 3.システム更新の仕組み化・管理コストの削減 ◼ CI/CD:継続的インテグレーション/デリバリー ◼ プログラム変更→サービスに自動反映 ◼ ヒューマンエラーを減らす ◼ システムの自動テスト ◼

    定期自動テストで稼働状況を監視 ◼ スクラム開発・定期リリース ◼ 毎回その時点でできているものをリリース ◼ IoTマイクのファームウェアのリモートアップデート ◼ 「マイクを全回収して更新」が不要に CircleCI GitHub (自動テストフレームワーク) (C) 2020 Hylable Inc.
  16. 音系スタートアップとしての成果 ◼ Hylable Discussion ◼ のべ17,000人/1,800時間以上の議論を収録&分析 ◼ 1つ1つの会議の参加人数をすべて合計 ◼ 小学生から社会人までの幅広い自然会話データは希少

    ◼ Hylable Discussionを利用した共同研究・共同開発 ◼ Web会議の定量化サービスHylableの開発 ◼ 音声系クラウドサービスの開発支援 (C) 2020 Hylable Inc.
  17. おわりに ◼ ハイラブル:音系スタートアップ ◼ 音環境分析でコミュニケーションを豊かにする ◼ Hylable Discussion ◼ 話し合いの定量化・可視化

    クラウドサービス ◼ Web会議の定量化・可視化サービス Hylableもよろしく ◼ 音に関わるみなさん! ◼ いっしょに頑張りましょう & 応援してね (C) 2020 Hylable Inc.