Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
技育展登壇資料 Omochi
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuki Yada
September 11, 2022
Programming
0
570
技育展登壇資料 Omochi
Yuki Yada
September 11, 2022
Tweet
Share
More Decks by Yuki Yada
See All by Yuki Yada
Vision Language Modelを活用した メルカリの類似画像レコメンドの性能改善
yadayuki
11
2.1k
DEIM2024 / 大規模言語モデルを用いたカテゴリ説明文付与によるニュース推薦の性能向上
yadayuki
1
170
【情報科学若手の会 2023秋 軽井沢】大規模言語モデル(BERT)を用いたニュース推薦のPyTorchによる実装と評価
yadayuki
1
910
インターン成果発表資料 / サイボウズ・フロントエンドエキスパートコース
yadayuki
0
1.9k
クックパッド・インターン成果発表
yadayuki
0
550
Other Decks in Programming
See All in Programming
「ブロックテーマでは再現できない」は本当か?
inc2734
0
1k
Oxlintはいいぞ
yug1224
5
1.4k
Gemini for developers
meteatamel
0
100
CSC307 Lecture 09
javiergs
PRO
1
840
生成AIを使ったコードレビューで定性的に品質カバー
chiilog
1
280
16年目のピクシブ百科事典を支える最新の技術基盤 / The Modern Tech Stack Powering Pixiv Encyclopedia in its 16th Year
ahuglajbclajep
5
1k
AI Schema Enrichment for your Oracle AI Database
thatjeffsmith
0
330
組織で育むオブザーバビリティ
ryota_hnk
0
180
責任感のあるCloudWatchアラームを設計しよう
akihisaikeda
3
180
AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門
masahiro_nishimi
6
680
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
200
並行開発のためのコードレビュー
miyukiw
0
1.2k
Featured
See All Featured
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
The Pragmatic Product Professional
lauravandoore
37
7.1k
Accessibility Awareness
sabderemane
0
57
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
The untapped power of vector embeddings
frankvandijk
1
1.6k
A better future with KSS
kneath
240
18k
Faster Mobile Websites
deanohume
310
31k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
The Curious Case for Waylosing
cassininazir
0
240
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
53
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
65
Transcript
全文検索エンジンOmochi 無駄開発部門 / 矢田宙生 ( yyada.jp )
作ったもの 全文検索エンジンの Goによるスクラッチ実装
なんで作った? 全文検索エンジンOmochi 世の役に立つ? 起業? 開発支援? コスト削減?
なんで作った? 全文検索エンジンOmochi 世の役に立つ? 起業? コスト削減? 面白そうだから。 開発支援?
全文検索エンジン・Omochi • 転置インデックス型全文検索エンジン "ドラえもん"という検索ワードで検索したら、 "ドラえもん"というワードを含む文書を返してくれる • 全文検索の部分をGoで全てスクラッチ実装 (「Elasticsearch ? そんなものナンセンスさ
😏」) • HTTP API経由で検索することが可能! ドラえもんで検索するとき : “/v1/document/search?keywords=ドラえもん” • 対応言語: 日本語 & 英語
転置インデックス is 何 1. "java ruby js" 2. "cpp java
rust" 3. "zig carbon rust" 全文検索の肝とも言える文書に登場するトークン(単語)と 文書情報を紐づけたようなデータ構造 文書
転置インデックス is 何 1. "java ruby js" 2. "cpp java
rust" 3. "zig carbon rust" { “java”: [ 1 ,2 ] “rust”: [ 2 , 3 ] “zig”: [ 3 ] …. } 全文検索の肝とも言える文書に登場するトークン(単語)と 文書情報を紐づけたようなデータ構造 文書 転置インデックス
Omochiの技術スタック
デモ🤩
反響😳 • 執筆した記事がzennでトレンド一位 • 有名 & 強い人が拡散してくれた Kosuke tsujino さん(検索エンジン開発者
at Google) mattnさん(Go Expert at メルカリ) • リポジトリのスター数: 65 (皆さん、是非 ⭐ してください🥺 )
まとめ
まとめ 車輪の再発明、 楽しいぞ!!!!!!! 🎉🎉🎉
ご静聴ありがとうございました!