Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Voyagerを利用した宿画像の最近傍探索による候補生成
Search
Yudai Hayashi
January 20, 2024
1
140
Voyagerを利用した宿画像の最近傍探索による候補生成
Yudai Hayashi
January 20, 2024
Tweet
Share
More Decks by Yudai Hayashi
See All by Yudai Hayashi
プロダクトのコードをPandasからPolarsへ書き換えた話
yudai00
6
1.5k
データサイエンティストになって得た学び
yudai00
1
44
社内での継続的な機械学習勉強会の開催のコツ
yudai00
2
560
会社訪問アプリ「Wantedly Visit」における新規ユーザーの行動量に基づいた推薦方策の選択
yudai00
0
1k
Polarsを活用した機械学習ジョブの高速化
yudai00
1
100
推薦データ分析コンペに参加して得た知見
yudai00
2
320
論文紹介:Unbiased Delayed Feedback Label Correction for Conversion Rate Prediction
yudai00
0
220
機械学習プロジェクトでのPythonアップデートの難しさと得られた知見
yudai00
3
250
RecSys2023論文読み会 - Augmented Negative Sampling for Collaborative Filtering
yudai00
1
880
Featured
See All Featured
For a Future-Friendly Web
brad_frost
173
9.2k
Making the Leap to Tech Lead
cromwellryan
127
8.7k
The World Runs on Bad Software
bkeepers
PRO
63
11k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
44
4.7k
Docker and Python
trallard
37
2.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
26
2.1k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
129
32k
Embracing the Ebb and Flow
colly
81
4.3k
Designing for humans not robots
tammielis
247
25k
How GitHub Uses GitHub to Build GitHub
holman
471
290k
Optimising Largest Contentful Paint
csswizardry
18
2.6k
Mobile First: as difficult as doing things right
swwweet
219
8.8k
Transcript
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024
- Yudai Hayashi
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 • 経歴:
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う • X: @python_walker • 趣味: ◦ 読書 ◦ 音楽聴くこと ◦ ウイスキー
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと • 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア
• どれくらいうまくいくのか
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成
スライド1枚に収まる分量で候補生成ができる
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 • セッションの最後の宿と 県を渡して検索
• Recall@20 = 0.06 • 県の人気宿を取ってく るとRecall@20 = 0.25 • 検索にかかる時間は 30秒くらい
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ • 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 •
簡単な実験結果の共有