Upgrade to Pro — share decks privately, control downloads, hide ads and more …

事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話

A279b5f566a4907f26babef2ff9d9475?s=47 MasahiroOsanai
June 11, 2019
690

事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話

白金鉱業vol.8の登壇資料です!

A279b5f566a4907f26babef2ff9d9475?s=128

MasahiroOsanai

June 11, 2019
Tweet

Transcript

  1. 事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話 2019-6-11 白金鉱業 Meetup Vol.8

  2. 小山内 将宏 (Qiita/Twitter/Medium全部 @koyamuchi) 今やっていること: Voicyの基盤開発/分析/プロダクト開発などデータが絡む部分はなんでもやります。 機械学習もやりますが、がっつりデータエンジニア &アナリスト ロールな人です! 得意なこと:

    GCP / AWS / Python / R / Scikit-learn /アクセス解析ツール全般 / BIツール全般 角を立てずに意見を述べる / どこに行ってもいじられる 分析官的キャリアサマリ : カカクコム(WEB)でBI基盤整備/広告予算最適化など -> BASE(WEB)でマーケティング/アプリのグロース/ファクトを追う文化の醸成 -> Voicy(音声)はデータ以外の業務も含めてなんでも屋 自己紹介 社員で行った福岡旅行の写真 ↓
  3. こんな記事書いてます

  4. 1. ビジネス視点のデータサイエンスwith音声の可能性が分かる! 2. 音声分析でVoicyが得た知見を一部お持ち帰り! fdsa 3. アナリストの幸福度を向上するための便利Tipsを知れる! 発表で得られる3つのこと

  5. Voicyの紹介 1

  6. Voicyのミッション 音声×テクノロジーでワクワクする社会を作る

  7. ボイスメディアVoicy パーソナリティが自らの声を通して声のブログや ニュースを放送しているボイスメディアです。 スマートフォンやウェブサイト、スマートスピーカーを 通していつでもどこでもリスナーの耳に届きます。

  8. 資金調達 約8.2億円の資金調達および事業提携

  9. None
  10. Voicyのデータチーム 2

  11. データで見るVoicy 約 2500,000 UU 1日 2,000 時間 TOPパーソナリティの再生時間 累計サービスUU数

  12. Voicyのデータ基盤 (ざっくりver)

  13. 大切にしていること スタートアップのデータサイエンスに求められるのは、 どれだけ事業価値(速さ❌量)を生み出せるか?の1点 音声では数多くの研究分野が存在していますが、今は、事業インパクトを産める 領域に絞り込んで、実装/検証を進めています。

  14. 閑話休題① SuperQueryを使うと、BigQueryの生産性が爆増して業務が捗る 1: 複数タブでクエリを非同期実行できる 2: Githubにクエリの履歴を無意識に ストックできる BigQueryの生産性⤴ 効果 (SQL

    IDE)
  15. Voicyとデータサイエンス 2

  16. Voicyが蓄積している生データ と分析官的切り口を紹介します!

  17. 1: 詳細な再生ログ - いつ?どこで?誰が?何を?聴いているのか?の再生ログを蓄積している。 - チャネルとしては、スマホ / スマートスピーカー / WEBブラウザ

    - ‘聴かれやすいコンテンツにはどのようなものがあるか ?’ / ‘声のピッチやトーンと、完聴率に関連性が 見られるか?’ など、面白いコンテンツを生み出すための分析をもっとやっていきたい。 - 日本語の精度はまだ課題があるものの、 STTによってテキスト化も可能なので、実質的には数万放 送分のテキストデータを保有しているとも言える。トピック抽出やタグ付けなど、テキスト解析も推し進 めていきたい。 離脱ポイントの把握 STTで文書に変換 分析切り口 : 音声 with ログ解析 / 音声 with 自然言語処理
  18. 閑話休題② Ipadの手書きアプリが分析結果の他部署 / 経営陣への共有に超絶役立つ To PDF 1: 情報によっては手書きの方が 伝達しやすい 2:

    メモ書きで細かい要素を削ぎ落とし過ぎず に内容を伝えられる ※アプリは一通り試したが NoteShelfがおすすめ 意思決定への貢献度⤴ 効果
  19.    2: アプリの行動ログ - 再生 / 録音の2種類のアプリケーションがありますが、両者で画面上でのアクションログを取得してい ます。 - サマライズに加えて、時系列でログを追うことで、 ”配信者がつまづいているポイントはどこか

    ?” / “音 声コンテンツを聴いて好きになるか ?”など、もっと簡単に音声を聴いて /録れるように仮説検証を行 なっています。 音声を聴いてハマるタイミングはいつ ? 録音でつまづいているタイミングはどこ ? 分析切り口 : 音声 with グロースハック
  20. 3: リスナーのメタ情報 - toCプロダクトであれば、属性や性別、 Twitter上のフォロー情報など。 toBプロダクトであれば、それら に加えて、部署 / 役職情報/組織エンゲージメント値などを収集しています。 -

    聴き手の事を詳細に知ることで、最適なレコメンデーションや精度の高いコンテンツ改善を行うことが できます。 部署Aの人は聴いて、Bの人はあまり聴いていない ? 社内報の熱心なファンは、組織エンゲージメントも高い ? 分析切り口 : 音声 with ピープルアナリティクス
  21. Metabaseをいろんな人にも おすすめしたくて、記事にも書きました! 1: ヌルサクでストレスが殆ど無い 2: APIやSlackなど多様な提供方式に対応 閑話休題③ Metabaseをフル活用すると、データ・ドリブンな文化作りに役立つ ダッシュボードUI APIテキストで一覧

    SlackBot Output 組織のデータ活用度⤴ 効果
  22. ・当たるコンテンツをデータのインサイ トを元に生み出していく 今 挑戦している3つのこと ・コンテキストに重きを置いたリアルタ イムレコメンデーション 音声を聴くことで ヒト・組織は元気になる ? 素敵な音声レコメンデーション

    は実現できるか ? 高品質なコンテンツの 流通量を増やす 音声 x テクノロジーでワクワクする社会を作る 音声の特性を生かして 人/組織を活性化する まだ見ぬ音声との接点を 創出し視線を上げる データを使って、再現性の高い ヒットコンテンツは生み出せる ? ・聴取状況と組織エンゲージメントの 相関性理解 Vision 分析テーマ 分析テーマ 分析テーマ
  23. 1: 詳細な再生ログ ・コンテキストに重きを置いたリアル イムレコメンデーション

  24. 1: 詳細な再生ログ インフルエンサーカテゴリ 英会話カテゴリ 中国語カテゴリも ニーズある?? ・当たるコンテンツをデータのインサ トを元に生み出していく まだ見ぬクラスタ/ヒットコンテンツの発掘

  25. 最後に!!

  26. チームと言ってましたが、現在は1人でやっています! もっと加速していきたいので、社外・アカデミック問わず一緒に音声 xデータの価値創造に挑戦したい方募集中! ここが1番大事! ランチだけでも熱烈大歓迎! 気軽に連絡ください!(Wantedly/Twitter)