Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024 - Yudai Hayashi
Slide 2
Slide 2 text
© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 ● 経歴: ○ 東京大学工学系研究科でPh.D取得 ○ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う ● X: @python_walker ● 趣味: ○ 読書 ○ 音楽聴くこと ○ ウイスキー
Slide 3
Slide 3 text
© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと ● 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア ● どれくらいうまくいくのか
Slide 4
Slide 4 text
© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html
Slide 5
Slide 5 text
© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成 スライド1枚に収まる分量で候補生成ができる
Slide 6
Slide 6 text
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく
Slide 7
Slide 7 text
© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 ● セッションの最後の宿と 県を渡して検索 ● Recall@20 = 0.06 ● 県の人気宿を取ってく るとRecall@20 = 0.25 ● 検索にかかる時間は 30秒くらい
Slide 8
Slide 8 text
© 2024 Wantedly, Inc. INTERNAL ONLY まとめ ● 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 ● 簡単な実験結果の共有