Upgrade to Pro — share decks privately, control downloads, hide ads and more …

事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話

MasahiroOsanai
June 11, 2019
870

事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話

白金鉱業vol.8の登壇資料です!

MasahiroOsanai

June 11, 2019
Tweet

Transcript

  1. 事業者視点で語る!
    Voicyが取り組む音声xデータサイエンスの話
    2019-6-11
    白金鉱業 Meetup Vol.8

    View Slide

  2. 小山内 将宏
    (Qiita/Twitter/Medium全部 @koyamuchi)
    今やっていること:
    Voicyの基盤開発/分析/プロダクト開発などデータが絡む部分はなんでもやります。
    機械学習もやりますが、がっつりデータエンジニア &アナリスト ロールな人です!
    得意なこと:
    GCP / AWS / Python / R / Scikit-learn /アクセス解析ツール全般 / BIツール全般
    角を立てずに意見を述べる / どこに行ってもいじられる
    分析官的キャリアサマリ :
    カカクコム(WEB)でBI基盤整備/広告予算最適化など
    -> BASE(WEB)でマーケティング/アプリのグロース/ファクトを追う文化の醸成
    -> Voicy(音声)はデータ以外の業務も含めてなんでも屋
    自己紹介
    社員で行った福岡旅行の写真 ↓

    View Slide

  3. こんな記事書いてます

    View Slide

  4. 1.
    ビジネス視点のデータサイエンスwith音声の可能性が分かる!
    2.
    音声分析でVoicyが得た知見を一部お持ち帰り!
    fdsa
    3.
    アナリストの幸福度を向上するための便利Tipsを知れる!
    発表で得られる3つのこと

    View Slide

  5. Voicyの紹介
    1

    View Slide

  6. Voicyのミッション
    音声×テクノロジーでワクワクする社会を作る

    View Slide

  7. ボイスメディアVoicy
    パーソナリティが自らの声を通して声のブログや
    ニュースを放送しているボイスメディアです。
    スマートフォンやウェブサイト、スマートスピーカーを
    通していつでもどこでもリスナーの耳に届きます。

    View Slide

  8. 資金調達
    約8.2億円の資金調達および事業提携

    View Slide

  9. View Slide

  10. Voicyのデータチーム
    2

    View Slide

  11. データで見るVoicy

    2500,000 UU
    1日
    2,000 時間
    TOPパーソナリティの再生時間
    累計サービスUU数

    View Slide

  12. Voicyのデータ基盤
    (ざっくりver)

    View Slide

  13. 大切にしていること
    スタートアップのデータサイエンスに求められるのは、
    どれだけ事業価値(速さ❌量)を生み出せるか?の1点
    音声では数多くの研究分野が存在していますが、今は、事業インパクトを産める
    領域に絞り込んで、実装/検証を進めています。

    View Slide

  14. 閑話休題①
    SuperQueryを使うと、BigQueryの生産性が爆増して業務が捗る
    1:
    複数タブでクエリを非同期実行できる
    2:
    Githubにクエリの履歴を無意識に
    ストックできる
    BigQueryの生産性⤴
    効果
    (SQL IDE)

    View Slide

  15. Voicyとデータサイエンス
    2

    View Slide

  16. Voicyが蓄積している生データ
    と分析官的切り口を紹介します!

    View Slide

  17. 1: 詳細な再生ログ
    - いつ?どこで?誰が?何を?聴いているのか?の再生ログを蓄積している。
    - チャネルとしては、スマホ / スマートスピーカー / WEBブラウザ
    - ‘聴かれやすいコンテンツにはどのようなものがあるか ?’ / ‘声のピッチやトーンと、完聴率に関連性が
    見られるか?’ など、面白いコンテンツを生み出すための分析をもっとやっていきたい。
    - 日本語の精度はまだ課題があるものの、 STTによってテキスト化も可能なので、実質的には数万放
    送分のテキストデータを保有しているとも言える。トピック抽出やタグ付けなど、テキスト解析も推し進
    めていきたい。
    離脱ポイントの把握 STTで文書に変換
    分析切り口 : 音声 with ログ解析 / 音声 with 自然言語処理

    View Slide

  18. 閑話休題②
    Ipadの手書きアプリが分析結果の他部署 / 経営陣への共有に超絶役立つ
    To PDF
    1:
    情報によっては手書きの方が
    伝達しやすい
    2:
    メモ書きで細かい要素を削ぎ落とし過ぎず
    に内容を伝えられる
    ※アプリは一通り試したが
    NoteShelfがおすすめ
    意思決定への貢献度⤴
    効果

    View Slide

  19.    2: アプリの行動ログ
    - 再生 / 録音の2種類のアプリケーションがありますが、両者で画面上でのアクションログを取得してい
    ます。
    - サマライズに加えて、時系列でログを追うことで、 ”配信者がつまづいているポイントはどこか ?” / “音
    声コンテンツを聴いて好きになるか ?”など、もっと簡単に音声を聴いて /録れるように仮説検証を行
    なっています。
    音声を聴いてハマるタイミングはいつ
    ? 録音でつまづいているタイミングはどこ
    ?
    分析切り口 : 音声 with グロースハック

    View Slide

  20. 3: リスナーのメタ情報
    - toCプロダクトであれば、属性や性別、 Twitter上のフォロー情報など。 toBプロダクトであれば、それら
    に加えて、部署 / 役職情報/組織エンゲージメント値などを収集しています。
    - 聴き手の事を詳細に知ることで、最適なレコメンデーションや精度の高いコンテンツ改善を行うことが
    できます。
    部署Aの人は聴いて、Bの人はあまり聴いていない
    ? 社内報の熱心なファンは、組織エンゲージメントも高い
    ?
    分析切り口 : 音声 with ピープルアナリティクス

    View Slide

  21. Metabaseをいろんな人にも
    おすすめしたくて、記事にも書きました!
    1:
    ヌルサクでストレスが殆ど無い
    2:
    APIやSlackなど多様な提供方式に対応
    閑話休題③
    Metabaseをフル活用すると、データ・ドリブンな文化作りに役立つ
    ダッシュボードUI
    APIテキストで一覧 SlackBot
    Output
    組織のデータ活用度⤴
    効果

    View Slide

  22. ・当たるコンテンツをデータのインサイ
    トを元に生み出していく
    今 挑戦している3つのこと
    ・コンテキストに重きを置いたリアルタ
    イムレコメンデーション
    音声を聴くことで
    ヒト・組織は元気になる ?
    素敵な音声レコメンデーション
    は実現できるか ?
    高品質なコンテンツの
    流通量を増やす
    音声 x テクノロジーでワクワクする社会を作る
    音声の特性を生かして
    人/組織を活性化する
    まだ見ぬ音声との接点を
    創出し視線を上げる
    データを使って、再現性の高い
    ヒットコンテンツは生み出せる ?
    ・聴取状況と組織エンゲージメントの
    相関性理解
    Vision
    分析テーマ 分析テーマ 分析テーマ

    View Slide

  23. 1: 詳細な再生ログ ・コンテキストに重きを置いたリアル
    イムレコメンデーション

    View Slide

  24. 1: 詳細な再生ログ
    インフルエンサーカテゴリ
    英会話カテゴリ
    中国語カテゴリも
    ニーズある??
    ・当たるコンテンツをデータのインサ
    トを元に生み出していく
    まだ見ぬクラスタ/ヒットコンテンツの発掘

    View Slide

  25. 最後に!!

    View Slide

  26. チームと言ってましたが、現在は1人でやっています!
    もっと加速していきたいので、社外・アカデミック問わず一緒に音声
    xデータの価値創造に挑戦したい方募集中!
    ここが1番大事!
    ランチだけでも熱烈大歓迎! 気軽に連絡ください!(Wantedly/Twitter)

    View Slide