Slide 1

Slide 1 text

© 2024 Wantedly, Inc. Voyagerを利用した宿画像の最近傍 探索による候補生成 atmaCup振り返り会LT Jan. 20 2024 - Yudai Hayashi

Slide 2

Slide 2 text

© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介 林 悠大 ● 経歴: ○ 東京大学工学系研究科でPh.D取得 ○ 2022年にウォンテッドリーにデータサイ エンティストとして新卒入社。推薦シス テムの開発を行う ● X: @python_walker ● 趣味: ○ 読書 ○ 音楽聴くこと ○ ウイスキー

Slide 3

Slide 3 text

© 2024 Wantedly, Inc. INTERNAL ONLY 今日話すこと ● 宿画像のembeddingとVoyagerを組み合わせて候補生成に活用する アイデア ● どれくらいうまくいくのか

Slide 4

Slide 4 text

© 2024 Wantedly, Inc. INTERNAL ONLY Spotifyが開発している近似最近傍探索ライブラリVoyager https://spotify.github.io/voyager/python/reference.html

Slide 5

Slide 5 text

© 2024 Wantedly, Inc. INTERNAL ONLY 画像が似ている宿の抽出 アイデア:セッションで見ている宿と似たような部屋の宿が予約される? インデックス作成 候補生成 スライド1枚に収まる分量で候補生成ができる

Slide 6

Slide 6 text

© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:インデックス作成 検索に必要な情報をまとめて 持っておく

Slide 7

Slide 7 text

© 2024 Wantedly, Inc. INTERNAL ONLY セッションで見ている県で絞った候補作成:検索 ● セッションの最後の宿と 県を渡して検索 ● Recall@20 = 0.06 ● 県の人気宿を取ってく るとRecall@20 = 0.25 ● 検索にかかる時間は 30秒くらい

Slide 8

Slide 8 text

© 2024 Wantedly, Inc. INTERNAL ONLY まとめ ● 宿画像のembeddingをVoyagerと組み合わせて候補生成を行う手法を紹介 ● 簡単な実験結果の共有