Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
search and community in cookpad 2019
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
genta kaneyama
September 25, 2019
Programming
2
2k
search and community in cookpad 2019
クックパッドのレシピ検索とレシピコミュニティ
cookpad product kitchen #4の発表資料です。
genta kaneyama
September 25, 2019
Tweet
Share
More Decks by genta kaneyama
See All by genta kaneyama
MOSHでの生成AI活用の取り組み
penguinco
0
210
行動ログでプロダクトを改善するには/exploit user behavior for product
penguinco
4
9.3k
Solr @ CROSS2015 C4
penguinco
1
1.4k
how to improve search
penguinco
8
2k
solrとelasticsearchの比較
penguinco
15
5.6k
Other Decks in Programming
See All in Programming
今、アーキテクトとして 品質保証にどう関わるか
nealle
0
200
AI主導でFastAPIのWebサービスを作るときに 人間が構造化すべき境界線
okajun35
0
610
nuget-server - あなたが必要だったNuGetサーバー
kekyo
PRO
0
190
Go 1.26でのsliceのメモリアロケーション最適化 / Go 1.26 リリースパーティ #go126party
mazrean
1
360
atmaCup #23でAIコーディングを活用した話
ml_bear
4
750
エージェント開発初心者の僕がエージェントを作った話と今後やりたいこと
thasu0123
0
230
エラーログのマスキングの仕組みづくりに役立ったASTの話
kumoichi
0
110
Geminiの機能を調べ尽くしてみた
naruyoshimi
0
200
CSC307 Lecture 14
javiergs
PRO
0
450
PostgreSQL を使った快適な go test 環境を求めて
otakakot
0
450
CSC307 Lecture 15
javiergs
PRO
0
220
今更考える「単一責任原則」 / Thinking about the Single Responsibility Principle
tooppoo
3
1.5k
Featured
See All Featured
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
370
Into the Great Unknown - MozCon
thekraken
40
2.3k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Darren the Foodie - Storyboard
khoart
PRO
3
2.8k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
82
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
130
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
240
Agile that works and the tools we love
rasmusluckow
331
21k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
95
The Mindset for Success: Future Career Progression
greggifford
PRO
0
270
Building AI with AI
inesmontani
PRO
1
770
Transcript
クックパッドのレシピ検索とレ シピコミュニティ 兼山 元太
自己紹介 兼山 元太 https://twitter.com/PENGUINANA_ 所属:Cookpad/会員事業部 担当:VP, Search
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
クックパッドのレシピ ・レシピ数: 約310万品 ・つくれぽ数: 2200万回 ・月間利用者数: 約5,400万人
クックパッドのレシピ検索 ・レシピ検索:年間 12億セッション ・検索語: 毎日 30万通り
クックパッドのレシピ ・ふつうの人が作った料理/工夫 ・食卓の定番になるレシピ ・目視でレビューされている 「その通りにやれば作れるか?」 「他者を不快にさせないか?」
コアとなる体験:投稿すると予想外の報酬 レシピをのせて、さがして、つくる 1)生活が変わるアイデアを発見できる 2)実際にやってみる 3)のせる人とさがす人がお互いの楽しいを増やせる
のせる人 と さがす人 ・つくれぽでつながる のせる人 と さがす人 ・作者さんの声 「私のレシピにつくれぽが来るとは 思ってなかったので素直に驚いた」
「来るのが嬉しくてレシピ投稿を続けてみた」
シンプルな材料のレシピ
ユーザによる多様なアレンジ
元となったレシピ
ユーザによる多様なアレンジ
コアとなる体験:献立が楽に決まる プレミアムサービスに一番期待していること: 1位 人気順や殿堂入りでレシピを検索できる:34% 2位 毎日の献立を決めるのが楽になる: 13% 3位 料理のレパートリーが増える: 11%
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
ランキング:コミュニティのための新着順 速く / できるだけ1on1 の つくれぽ(マッチ)を起こす
ランキング:コミュニティのための新着順 ・260万/316万品が見られた。 ・今年公開のレシピのクリック: ・有料ユーザー:12% ・フリーユーザー:88% 検索からのレシピクリック(直近1ヶ月)
ランキング:レシピがさがせる新着順 「見つかりそう」な印象が大事。 関連検索を利用し 先回りして検索。 リランクする。
ランキング:ジレンマ 先頭に関連性の高いレシピを集めると、 ポジションバイアスによって 見られるレシピが偏ってしまう。 多くのレシピを見てもらう機会が減る。
ランキング:人気順 人気度が大事。 クエリとレシピの関連性も大事。 前日のクリック情報で訂正。 リランクする。
いつもの検索語で、新しい発見ができる。
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
検索基盤:検索エンジン ・Apache Solr + Rails ・多様な検索オプション、ランキングを提供 ・フィールドの数:100以上 SQLでDWHからPULLして作成。
検索基盤:辞書 ・Rails Gem(Rails + GDBM) ・世にある検索フレーズの全てを知るテーブル ・MeCabのユーザー辞書も管理 ・GDBMでAppサーバーに同居、高速に参照
検索基盤:分かち書きの意義 ・分かち書きの意義 「鰹 vs 鰹節」問題 辞書で鰹節が「鰹」「節」になりにくくした。 (鰹節の綴り違いは主だったものだけで60通)
検索基盤:分かち書きの意義 結果: ・ヒット数:4,900→3,400品 ・CTR:0.27→0.52まで上昇。 人気順もTOP3が全部鰹節だったのが、 TOP30までみてもミスマッチは1品。
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
ログ分析:DWH(Redshift) ここまでの作業のほぼすべての前提! 全てのデータとログが一元化されたDWHが プロダクトのワンストップのソース。
Agenda クックパッドとコアの体験 ランキングの工夫 検索基盤 ログ分析 これからやりたいこと
これからやりたいこと: セッション分析の精緻化 ・遠いコンバージョンに対して どう最適化するのか? ・より多くのレシピ作者に 再び投稿してもらうにはどうすれば?
これからやりたいこと: コンテキストに合わせた検索 ・使っている人の属性 シーンの多様さに対応する