Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
検索エンジン自作入門
Search
Masanori Ogino
September 25, 2021
Technology
0
120
検索エンジン自作入門
2021年9月25日の読書会にて使用したスライド。
Masanori Ogino
September 25, 2021
Tweet
Share
More Decks by Masanori Ogino
See All by Masanori Ogino
Logik: A Free and Open-source FPGA Toolchain
omasanori
0
350
Status of ALICE T2 Sites in Japan
omasanori
0
16
A Linux smartphone? What's the difference from Android?
omasanori
0
170
SJ3をたずねて
omasanori
1
120
Progress Report (2023-02-19)
omasanori
0
180
LinuxカーネルのFPGAサブシステム
omasanori
0
920
動かしてわかる CPUの作り方10講
omasanori
0
92
Rust入門以前:発表版
omasanori
13
2.5k
Other Decks in Technology
See All in Technology
NIKKEI Tech Talk #41: セキュア・バイ・デザインからクラウド管理を考える
sekido
PRO
0
180
Fashion×AI「似合う」を届けるためのWEARのAI戦略
zozotech
PRO
2
1k
寫了幾年 Code,然後呢?軟體工程師必須重新認識的 DevOps
cheng_wei_chen
1
1.5k
AI時代の新規LLMプロダクト開発: Findy Insightsを3ヶ月で立ち上げた舞台裏と振り返り
dakuon
0
320
Amazon Connect アップデート! AIエージェントにMCPツールを設定してみた!
ysuzuki
0
110
生成AI活用の型ハンズオン〜顧客課題起点で設計する7つのステップ
yushin_n
0
260
通勤手当申請チェックエージェント開発のリアル
whisaiyo
3
270
文字列の並び順 / Unicode Collation
tmtms
3
620
モダンデータスタックの理想と現実の間で~1.3億人Vポイントデータ基盤の現在地とこれから~
taromatsui_cccmkhd
1
110
特別捜査官等研修会
nomizone
0
310
半年で、AIゼロ知識から AI中心開発組織の変革担当に至るまで
rfdnxbro
0
110
2025年 開発生産「可能」性向上報告 サイロ解消からチームが能動性を獲得するまで/ 20251216 Naoki Takahashi
shift_evolve
PRO
2
210
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Speed Design
sergeychernyshev
33
1.4k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Designing for humans not robots
tammielis
254
26k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
2
3.8k
Designing for Timeless Needs
cassininazir
0
86
Designing Powerful Visuals for Engaging Learning
tmiket
0
180
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.4k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Done Done
chrislema
186
16k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
85
Transcript
検索エンジン自作入門 手を動かしながら見渡す検索の舞台裏 Masanori Ogino DoC on 2021-09-25
Table of Contents 1. 今回紹介する本 2. 読もうと思ったきっかけ 3. 感想 4.
おすすめポイント 1
今回紹介する本
今回紹介する本 題 検索エンジン自作入門 著 山田浩之、末永匡a 頁 224 ページ 年 2014
年 版 技術評論社 PDF EPUB aニコニコ周辺文化に親しんだ人なら 「グニャラくん」の方がピンと来るかも。 2
今回紹介する本 DRM1 1各ページにユーザ名とメールアドレスの透かしが入っている。 こうしたデッドコピー流通抑止手法を social DRM と呼ぶ場合もあるが、 今回は DRM として扱わないものとする。
3
今回紹介する本 Figure 1: The official video of Drake, “Hotline Bling”.
https://www.youtube.com/watch?v=uxpDa-c-4Mc 4
読もうと思ったきっかけ
読もうと思ったきっかけ • Google の検索結果がイマイチ、でも Bing2も…… • プライバシー:DuckDuckGo は本当に信頼できるのか? • DDG
がダメなら Startpage? Searx セルフホスト? 「どうちがうの? 同じようなものじゃない。 もっとホンシツを見ようよ、なるほどくん。 」 —— 綾里真宵 2検索結果上位 5 件が広告だったときは流石にいかがなものかと 思った。 5
読もうと思ったきっかけ メタサーチエンジンで検索の質を向上できるのか? Big Tech のリソースなしには、もはや Web 検索を実現する ことはできないのか? Web 全体を網羅することはできないにしても、
“十分良い” 検索エンジンを作るのは可能なのではないか? 6
感想
感想 • 難易度はやさしめ • ただし、プログラミング入門は済ませている前提 • 手を動かしながら読むのによい本 • 私は C++と
TypeScript で少しずつ書き進めている • アルゴリズムの種類は絞り気味 • 本格的な専門書に進む前の一冊目として 7
おすすめポイント
おすすめポイント • 自然言語処理の前提知識は不要 • サンプルコードが本文にベタ貼りされてない (サポートページからダウンロードすること) • 永続化を SQLite に任せている
• 索引に注力してデータ構造や永続化を省く割り切り 8