Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話
MasahiroOsanai
June 11, 2019
2
810
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話
白金鉱業vol.8の登壇資料です!
MasahiroOsanai
June 11, 2019
Tweet
Share
More Decks by MasahiroOsanai
See All by MasahiroOsanai
(多分)あなたの知らないグラフデータベースの世界
osapiii
0
29
Voicyデータ活用ハンドブック_2019年4月15日_update.pdf
osapiii
0
140
Firebase Predictionsで始める 1歩先を読むグロース戦略
osapiii
9
2.2k
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
151
13k
Gamification - CAS2011
davidbonilla
75
3.9k
Fashionably flexible responsive web design (full day workshop)
malarkey
396
62k
Three Pipe Problems
jasonvnalue
89
8.7k
GitHub's CSS Performance
jonrohan
1020
420k
KATA
mclloyd
7
8.8k
Infographics Made Easy
chrislema
233
17k
How STYLIGHT went responsive
nonsquared
85
4k
Testing 201, or: Great Expectations
jmmastey
21
5.5k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
107
16k
Building Adaptive Systems
keathley
25
1.2k
Pencils Down: Stop Designing & Start Developing
hursman
113
9.8k
Transcript
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話 2019-6-11 白金鉱業 Meetup Vol.8
小山内 将宏 (Qiita/Twitter/Medium全部 @koyamuchi) 今やっていること: Voicyの基盤開発/分析/プロダクト開発などデータが絡む部分はなんでもやります。 機械学習もやりますが、がっつりデータエンジニア &アナリスト ロールな人です! 得意なこと:
GCP / AWS / Python / R / Scikit-learn /アクセス解析ツール全般 / BIツール全般 角を立てずに意見を述べる / どこに行ってもいじられる 分析官的キャリアサマリ : カカクコム(WEB)でBI基盤整備/広告予算最適化など -> BASE(WEB)でマーケティング/アプリのグロース/ファクトを追う文化の醸成 -> Voicy(音声)はデータ以外の業務も含めてなんでも屋 自己紹介 社員で行った福岡旅行の写真 ↓
こんな記事書いてます
1. ビジネス視点のデータサイエンスwith音声の可能性が分かる! 2. 音声分析でVoicyが得た知見を一部お持ち帰り! fdsa 3. アナリストの幸福度を向上するための便利Tipsを知れる! 発表で得られる3つのこと
Voicyの紹介 1
Voicyのミッション 音声×テクノロジーでワクワクする社会を作る
ボイスメディアVoicy パーソナリティが自らの声を通して声のブログや ニュースを放送しているボイスメディアです。 スマートフォンやウェブサイト、スマートスピーカーを 通していつでもどこでもリスナーの耳に届きます。
資金調達 約8.2億円の資金調達および事業提携
None
Voicyのデータチーム 2
データで見るVoicy 約 2500,000 UU 1日 2,000 時間 TOPパーソナリティの再生時間 累計サービスUU数
Voicyのデータ基盤 (ざっくりver)
大切にしていること スタートアップのデータサイエンスに求められるのは、 どれだけ事業価値(速さ❌量)を生み出せるか?の1点 音声では数多くの研究分野が存在していますが、今は、事業インパクトを産める 領域に絞り込んで、実装/検証を進めています。
閑話休題① SuperQueryを使うと、BigQueryの生産性が爆増して業務が捗る 1: 複数タブでクエリを非同期実行できる 2: Githubにクエリの履歴を無意識に ストックできる BigQueryの生産性⤴ 効果 (SQL
IDE)
Voicyとデータサイエンス 2
Voicyが蓄積している生データ と分析官的切り口を紹介します!
1: 詳細な再生ログ - いつ?どこで?誰が?何を?聴いているのか?の再生ログを蓄積している。 - チャネルとしては、スマホ / スマートスピーカー / WEBブラウザ
- ‘聴かれやすいコンテンツにはどのようなものがあるか ?’ / ‘声のピッチやトーンと、完聴率に関連性が 見られるか?’ など、面白いコンテンツを生み出すための分析をもっとやっていきたい。 - 日本語の精度はまだ課題があるものの、 STTによってテキスト化も可能なので、実質的には数万放 送分のテキストデータを保有しているとも言える。トピック抽出やタグ付けなど、テキスト解析も推し進 めていきたい。 離脱ポイントの把握 STTで文書に変換 分析切り口 : 音声 with ログ解析 / 音声 with 自然言語処理
閑話休題② Ipadの手書きアプリが分析結果の他部署 / 経営陣への共有に超絶役立つ To PDF 1: 情報によっては手書きの方が 伝達しやすい 2:
メモ書きで細かい要素を削ぎ落とし過ぎず に内容を伝えられる ※アプリは一通り試したが NoteShelfがおすすめ 意思決定への貢献度⤴ 効果
2: アプリの行動ログ - 再生 / 録音の2種類のアプリケーションがありますが、両者で画面上でのアクションログを取得してい ます。 - サマライズに加えて、時系列でログを追うことで、 ”配信者がつまづいているポイントはどこか
?” / “音 声コンテンツを聴いて好きになるか ?”など、もっと簡単に音声を聴いて /録れるように仮説検証を行 なっています。 音声を聴いてハマるタイミングはいつ ? 録音でつまづいているタイミングはどこ ? 分析切り口 : 音声 with グロースハック
3: リスナーのメタ情報 - toCプロダクトであれば、属性や性別、 Twitter上のフォロー情報など。 toBプロダクトであれば、それら に加えて、部署 / 役職情報/組織エンゲージメント値などを収集しています。 -
聴き手の事を詳細に知ることで、最適なレコメンデーションや精度の高いコンテンツ改善を行うことが できます。 部署Aの人は聴いて、Bの人はあまり聴いていない ? 社内報の熱心なファンは、組織エンゲージメントも高い ? 分析切り口 : 音声 with ピープルアナリティクス
Metabaseをいろんな人にも おすすめしたくて、記事にも書きました! 1: ヌルサクでストレスが殆ど無い 2: APIやSlackなど多様な提供方式に対応 閑話休題③ Metabaseをフル活用すると、データ・ドリブンな文化作りに役立つ ダッシュボードUI APIテキストで一覧
SlackBot Output 組織のデータ活用度⤴ 効果
・当たるコンテンツをデータのインサイ トを元に生み出していく 今 挑戦している3つのこと ・コンテキストに重きを置いたリアルタ イムレコメンデーション 音声を聴くことで ヒト・組織は元気になる ? 素敵な音声レコメンデーション
は実現できるか ? 高品質なコンテンツの 流通量を増やす 音声 x テクノロジーでワクワクする社会を作る 音声の特性を生かして 人/組織を活性化する まだ見ぬ音声との接点を 創出し視線を上げる データを使って、再現性の高い ヒットコンテンツは生み出せる ? ・聴取状況と組織エンゲージメントの 相関性理解 Vision 分析テーマ 分析テーマ 分析テーマ
1: 詳細な再生ログ ・コンテキストに重きを置いたリアル イムレコメンデーション
1: 詳細な再生ログ インフルエンサーカテゴリ 英会話カテゴリ 中国語カテゴリも ニーズある?? ・当たるコンテンツをデータのインサ トを元に生み出していく まだ見ぬクラスタ/ヒットコンテンツの発掘
最後に!!
チームと言ってましたが、現在は1人でやっています! もっと加速していきたいので、社外・アカデミック問わず一緒に音声 xデータの価値創造に挑戦したい方募集中! ここが1番大事! ランチだけでも熱烈大歓迎! 気軽に連絡ください!(Wantedly/Twitter)