Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話
Search
MasahiroOsanai
June 11, 2019
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話
白金鉱業vol.8の登壇資料です!
MasahiroOsanai
June 11, 2019
More Decks by MasahiroOsanai
See All by MasahiroOsanai
(多分)あなたの知らないグラフデータベースの世界
osapiii
0
60
Voicyデータ活用ハンドブック_2019年4月15日_update.pdf
osapiii
0
190
Firebase Predictionsで始める 1歩先を読むグロース戦略
osapiii
8
3.2k
Featured
See All Featured
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
Making Projects Easy
brettharned
120
6.7k
Amusing Abliteration
ianozsvald
1
200
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
How to Ace a Technical Interview
jacobian
281
24k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
71
40k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Designing for humans not robots
tammielis
254
26k
Docker and Python
trallard
47
3.9k
Building the Perfect Custom Keyboard
takai
2
790
Transcript
事業者視点で語る! Voicyが取り組む音声xデータサイエンスの話 2019-6-11 白金鉱業 Meetup Vol.8
小山内 将宏 (Qiita/Twitter/Medium全部 @koyamuchi) 今やっていること: Voicyの基盤開発/分析/プロダクト開発などデータが絡む部分はなんでもやります。 機械学習もやりますが、がっつりデータエンジニア &アナリスト ロールな人です! 得意なこと:
GCP / AWS / Python / R / Scikit-learn /アクセス解析ツール全般 / BIツール全般 角を立てずに意見を述べる / どこに行ってもいじられる 分析官的キャリアサマリ : カカクコム(WEB)でBI基盤整備/広告予算最適化など -> BASE(WEB)でマーケティング/アプリのグロース/ファクトを追う文化の醸成 -> Voicy(音声)はデータ以外の業務も含めてなんでも屋 自己紹介 社員で行った福岡旅行の写真 ↓
こんな記事書いてます
1. ビジネス視点のデータサイエンスwith音声の可能性が分かる! 2. 音声分析でVoicyが得た知見を一部お持ち帰り! fdsa 3. アナリストの幸福度を向上するための便利Tipsを知れる! 発表で得られる3つのこと
Voicyの紹介 1
Voicyのミッション 音声×テクノロジーでワクワクする社会を作る
ボイスメディアVoicy パーソナリティが自らの声を通して声のブログや ニュースを放送しているボイスメディアです。 スマートフォンやウェブサイト、スマートスピーカーを 通していつでもどこでもリスナーの耳に届きます。
資金調達 約8.2億円の資金調達および事業提携
None
Voicyのデータチーム 2
データで見るVoicy 約 2500,000 UU 1日 2,000 時間 TOPパーソナリティの再生時間 累計サービスUU数
Voicyのデータ基盤 (ざっくりver)
大切にしていること スタートアップのデータサイエンスに求められるのは、 どれだけ事業価値(速さ❌量)を生み出せるか?の1点 音声では数多くの研究分野が存在していますが、今は、事業インパクトを産める 領域に絞り込んで、実装/検証を進めています。
閑話休題① SuperQueryを使うと、BigQueryの生産性が爆増して業務が捗る 1: 複数タブでクエリを非同期実行できる 2: Githubにクエリの履歴を無意識に ストックできる BigQueryの生産性⤴ 効果 (SQL
IDE)
Voicyとデータサイエンス 2
Voicyが蓄積している生データ と分析官的切り口を紹介します!
1: 詳細な再生ログ - いつ?どこで?誰が?何を?聴いているのか?の再生ログを蓄積している。 - チャネルとしては、スマホ / スマートスピーカー / WEBブラウザ
- ‘聴かれやすいコンテンツにはどのようなものがあるか ?’ / ‘声のピッチやトーンと、完聴率に関連性が 見られるか?’ など、面白いコンテンツを生み出すための分析をもっとやっていきたい。 - 日本語の精度はまだ課題があるものの、 STTによってテキスト化も可能なので、実質的には数万放 送分のテキストデータを保有しているとも言える。トピック抽出やタグ付けなど、テキスト解析も推し進 めていきたい。 離脱ポイントの把握 STTで文書に変換 分析切り口 : 音声 with ログ解析 / 音声 with 自然言語処理
閑話休題② Ipadの手書きアプリが分析結果の他部署 / 経営陣への共有に超絶役立つ To PDF 1: 情報によっては手書きの方が 伝達しやすい 2:
メモ書きで細かい要素を削ぎ落とし過ぎず に内容を伝えられる ※アプリは一通り試したが NoteShelfがおすすめ 意思決定への貢献度⤴ 効果
2: アプリの行動ログ - 再生 / 録音の2種類のアプリケーションがありますが、両者で画面上でのアクションログを取得してい ます。 - サマライズに加えて、時系列でログを追うことで、 ”配信者がつまづいているポイントはどこか
?” / “音 声コンテンツを聴いて好きになるか ?”など、もっと簡単に音声を聴いて /録れるように仮説検証を行 なっています。 音声を聴いてハマるタイミングはいつ ? 録音でつまづいているタイミングはどこ ? 分析切り口 : 音声 with グロースハック
3: リスナーのメタ情報 - toCプロダクトであれば、属性や性別、 Twitter上のフォロー情報など。 toBプロダクトであれば、それら に加えて、部署 / 役職情報/組織エンゲージメント値などを収集しています。 -
聴き手の事を詳細に知ることで、最適なレコメンデーションや精度の高いコンテンツ改善を行うことが できます。 部署Aの人は聴いて、Bの人はあまり聴いていない ? 社内報の熱心なファンは、組織エンゲージメントも高い ? 分析切り口 : 音声 with ピープルアナリティクス
Metabaseをいろんな人にも おすすめしたくて、記事にも書きました! 1: ヌルサクでストレスが殆ど無い 2: APIやSlackなど多様な提供方式に対応 閑話休題③ Metabaseをフル活用すると、データ・ドリブンな文化作りに役立つ ダッシュボードUI APIテキストで一覧
SlackBot Output 組織のデータ活用度⤴ 効果
・当たるコンテンツをデータのインサイ トを元に生み出していく 今 挑戦している3つのこと ・コンテキストに重きを置いたリアルタ イムレコメンデーション 音声を聴くことで ヒト・組織は元気になる ? 素敵な音声レコメンデーション
は実現できるか ? 高品質なコンテンツの 流通量を増やす 音声 x テクノロジーでワクワクする社会を作る 音声の特性を生かして 人/組織を活性化する まだ見ぬ音声との接点を 創出し視線を上げる データを使って、再現性の高い ヒットコンテンツは生み出せる ? ・聴取状況と組織エンゲージメントの 相関性理解 Vision 分析テーマ 分析テーマ 分析テーマ
1: 詳細な再生ログ ・コンテキストに重きを置いたリアル イムレコメンデーション
1: 詳細な再生ログ インフルエンサーカテゴリ 英会話カテゴリ 中国語カテゴリも ニーズある?? ・当たるコンテンツをデータのインサ トを元に生み出していく まだ見ぬクラスタ/ヒットコンテンツの発掘
最後に!!
チームと言ってましたが、現在は1人でやっています! もっと加速していきたいので、社外・アカデミック問わず一緒に音声 xデータの価値創造に挑戦したい方募集中! ここが1番大事! ランチだけでも熱烈大歓迎! 気軽に連絡ください!(Wantedly/Twitter)