Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Voyagerを利用した宿画像の最近傍探索による候補生成
Search
Yudai Hayashi
January 20, 2024
1
180
Voyagerを利用した宿画像の最近傍探索による候補生成
Yudai Hayashi
January 20, 2024
Tweet
Share
More Decks by Yudai Hayashi
See All by Yudai Hayashi
BigQueryで作る簡単なFeature Store
yudai00
2
200
プロダクトのコードをPandasからPolarsへ書き換えた話
yudai00
8
2.4k
データサイエンティストになって得た学び
yudai00
1
100
社内での継続的な機械学習勉強会の開催のコツ
yudai00
2
630
会社訪問アプリ「Wantedly Visit」における新規ユーザーの行動量に基づいた推薦方策の選択
yudai00
0
1.4k
Polarsを活用した機械学習ジョブの高速化
yudai00
1
190
推薦データ分析コンペに参加して得た知見
yudai00
2
390
論文紹介:Unbiased Delayed Feedback Label Correction for Conversion Rate Prediction
yudai00
0
290
機械学習プロジェクトでのPythonアップデートの難しさと得られた知見
yudai00
3
300
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
133
8.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
92
16k
What's in a price? How to price your products and services
michaelherold
243
12k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
700
Bash Introduction
62gerente
608
210k
Six Lessons from altMBA
skipperchong
26
3.5k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
27
2k
Documentation Writing (for coders)
carmenintech
65
4.4k
Writing Fast Ruby
sferik
627
61k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Facilitating Awesome Meetings
lara
49
6.1k
Done Done
chrislema
181
16k
Transcript
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024
- Yudai Hayashi
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 • 経歴:
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う • X: @python_walker • 趣味: ◦ 読書 ◦ 音楽聴くこと ◦ ウイスキー
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと • 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア
• どれくらいうまくいくのか
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成
スライド1枚に収まる分量で候補生成ができる
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 • セッションの最後の宿と 県を渡して検索
• Recall@20 = 0.06 • 県の人気宿を取ってく るとRecall@20 = 0.25 • 検索にかかる時間は 30秒くらい
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ • 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 •
簡単な実験結果の共有