Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Voyagerを利用した宿画像の最近傍探索による候補生成
Search
Yudai Hayashi
January 20, 2024
1
230
Voyagerを利用した宿画像の最近傍探索による候補生成
Yudai Hayashi
January 20, 2024
Tweet
Share
More Decks by Yudai Hayashi
See All by Yudai Hayashi
Wantedly Visitにおけるフリーワード検索時の推薦のオンライン化事例紹介
yudai00
1
170
RustとPyTorchで作る推論サーバー
yudai00
11
6.9k
BigQueryで作る簡単なFeature Store
yudai00
2
310
プロダクトのコードをPandasからPolarsへ書き換えた話
yudai00
8
3.3k
データサイエンティストになって得た学び
yudai00
1
200
社内での継続的な機械学習勉強会の開催のコツ
yudai00
2
730
会社訪問アプリ「Wantedly Visit」における新規ユーザーの行動量に基づいた推薦方策の選択
yudai00
0
1.6k
Polarsを活用した機械学習ジョブの高速化
yudai00
1
300
推薦データ分析コンペに参加して得た知見
yudai00
2
440
Featured
See All Featured
RailsConf 2023
tenderlove
29
1k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
Into the Great Unknown - MozCon
thekraken
35
1.6k
Navigating Team Friction
lara
183
15k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Designing Experiences People Love
moore
140
23k
KATA
mclloyd
29
14k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Transcript
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024
- Yudai Hayashi
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 • 経歴:
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う • X: @python_walker • 趣味: ◦ 読書 ◦ 音楽聴くこと ◦ ウイスキー
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと • 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア
• どれくらいうまくいくのか
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成
スライド1枚に収まる分量で候補生成ができる
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 • セッションの最後の宿と 県を渡して検索
• Recall@20 = 0.06 • 県の人気宿を取ってく るとRecall@20 = 0.25 • 検索にかかる時間は 30秒くらい
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ • 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 •
簡単な実験結果の共有