Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Voyagerを利用した宿画像の最近傍探索による候補生成
Search
Yudai Hayashi
January 20, 2024
1
240
Voyagerを利用した宿画像の最近傍探索による候補生成
Yudai Hayashi
January 20, 2024
Tweet
Share
More Decks by Yudai Hayashi
See All by Yudai Hayashi
相互推薦システムでのPseudo Label を活用したマッチ予測精度向上の取り組み
yudai00
1
750
Wantedly Visitにおけるフリーワード検索時の推薦のオンライン化事例紹介
yudai00
1
210
RustとPyTorchで作る推論サーバー
yudai00
11
7.1k
BigQueryで作る簡単なFeature Store
yudai00
2
340
プロダクトのコードをPandasからPolarsへ書き換えた話
yudai00
8
3.5k
データサイエンティストになって得た学び
yudai00
1
220
社内での継続的な機械学習勉強会の開催のコツ
yudai00
2
750
会社訪問アプリ「Wantedly Visit」における新規ユーザーの行動量に基づいた推薦方策の選択
yudai00
0
1.8k
Polarsを活用した機械学習ジョブの高速化
yudai00
1
330
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
693
190k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.4k
Building Adaptive Systems
keathley
41
2.5k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Raft: Consensus for Rubyists
vanstee
137
6.9k
Code Reviewing Like a Champion
maltzj
522
40k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
19
1.1k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.3k
Stop Working from a Prison Cell
hatefulcrawdad
268
20k
Embracing the Ebb and Flow
colly
85
4.6k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
119
51k
Transcript
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024
- Yudai Hayashi
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 • 経歴:
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う • X: @python_walker • 趣味: ◦ 読書 ◦ 音楽聴くこと ◦ ウイスキー
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと • 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア
• どれくらいうまくいくのか
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成
スライド1枚に収まる分量で候補生成ができる
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 • セッションの最後の宿と 県を渡して検索
• Recall@20 = 0.06 • 県の人気宿を取ってく るとRecall@20 = 0.25 • 検索にかかる時間は 30秒くらい
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ • 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 •
簡単な実験結果の共有