Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
検索エンジン自作入門
Search
Masanori Ogino
September 25, 2021
Technology
0
96
検索エンジン自作入門
2021年9月25日の読書会にて使用したスライド。
Masanori Ogino
September 25, 2021
Tweet
Share
More Decks by Masanori Ogino
See All by Masanori Ogino
A Linux smartphone? What's the difference from Android?
omasanori
0
120
SJ3をたずねて
omasanori
1
78
Progress Report (2023-02-19)
omasanori
0
120
LinuxカーネルのFPGAサブシステム
omasanori
0
800
動かしてわかる CPUの作り方10講
omasanori
0
58
Rust入門以前:発表版
omasanori
13
2.4k
Other Decks in Technology
See All in Technology
Incident Response Practices: Waroom's Features and Future Challenges
rrreeeyyy
0
150
Amazon CloudWatch Network Monitor のススメ
yuki_ink
0
170
ドメインの本質を掴む / Get the essence of the domain
sinsoku
2
140
The Role of Developer Relations in AI Product Success.
giftojabu1
0
110
社内で最大の技術的負債のリファクタリングに取り組んだお話し
kidooonn
1
510
mikroBus HAT を用いた簡易ベアメタル開発
tarotene
0
330
TinyGoを使ったVSCode拡張機能実装
askua
2
210
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
660
Intuneお役立ちツールのご紹介
sukank
3
770
FOSS4G 2024 Japan コアデイ 一般発表25 PythonでPLATEAUのデータを手軽に扱ってみる
ra0kley
1
140
SREの組織類型に応じた リーダシップの考察
kenta_hi
PRO
1
650
TanStack Routerに移行するのかい しないのかい、どっちなんだい! / Are you going to migrate to TanStack Router or not? Which one is it?
kaminashi
0
370
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Optimizing for Happiness
mojombo
376
70k
Being A Developer After 40
akosma
86
590k
Making the Leap to Tech Lead
cromwellryan
133
8.9k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
65k
Designing for Performance
lara
604
68k
Statistics for Hackers
jakevdp
796
220k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Agile that works and the tools we love
rasmusluckow
327
21k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
400
Navigating Team Friction
lara
183
14k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Transcript
検索エンジン自作入門 手を動かしながら見渡す検索の舞台裏 Masanori Ogino DoC on 2021-09-25
Table of Contents 1. 今回紹介する本 2. 読もうと思ったきっかけ 3. 感想 4.
おすすめポイント 1
今回紹介する本
今回紹介する本 題 検索エンジン自作入門 著 山田浩之、末永匡a 頁 224 ページ 年 2014
年 版 技術評論社 PDF EPUB aニコニコ周辺文化に親しんだ人なら 「グニャラくん」の方がピンと来るかも。 2
今回紹介する本 DRM1 1各ページにユーザ名とメールアドレスの透かしが入っている。 こうしたデッドコピー流通抑止手法を social DRM と呼ぶ場合もあるが、 今回は DRM として扱わないものとする。
3
今回紹介する本 Figure 1: The official video of Drake, “Hotline Bling”.
https://www.youtube.com/watch?v=uxpDa-c-4Mc 4
読もうと思ったきっかけ
読もうと思ったきっかけ • Google の検索結果がイマイチ、でも Bing2も…… • プライバシー:DuckDuckGo は本当に信頼できるのか? • DDG
がダメなら Startpage? Searx セルフホスト? 「どうちがうの? 同じようなものじゃない。 もっとホンシツを見ようよ、なるほどくん。 」 —— 綾里真宵 2検索結果上位 5 件が広告だったときは流石にいかがなものかと 思った。 5
読もうと思ったきっかけ メタサーチエンジンで検索の質を向上できるのか? Big Tech のリソースなしには、もはや Web 検索を実現する ことはできないのか? Web 全体を網羅することはできないにしても、
“十分良い” 検索エンジンを作るのは可能なのではないか? 6
感想
感想 • 難易度はやさしめ • ただし、プログラミング入門は済ませている前提 • 手を動かしながら読むのによい本 • 私は C++と
TypeScript で少しずつ書き進めている • アルゴリズムの種類は絞り気味 • 本格的な専門書に進む前の一冊目として 7
おすすめポイント
おすすめポイント • 自然言語処理の前提知識は不要 • サンプルコードが本文にベタ貼りされてない (サポートページからダウンロードすること) • 永続化を SQLite に任せている
• 索引に注力してデータ構造や永続化を省く割り切り 8