Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
検索エンジン自作入門
Search
Masanori Ogino
September 25, 2021
Technology
0
120
検索エンジン自作入門
2021年9月25日の読書会にて使用したスライド。
Masanori Ogino
September 25, 2021
Tweet
Share
More Decks by Masanori Ogino
See All by Masanori Ogino
Logik: A Free and Open-source FPGA Toolchain
omasanori
0
320
Status of ALICE T2 Sites in Japan
omasanori
0
14
A Linux smartphone? What's the difference from Android?
omasanori
0
170
SJ3をたずねて
omasanori
1
120
Progress Report (2023-02-19)
omasanori
0
180
LinuxカーネルのFPGAサブシステム
omasanori
0
910
動かしてわかる CPUの作り方10講
omasanori
0
91
Rust入門以前:発表版
omasanori
13
2.5k
Other Decks in Technology
See All in Technology
経営から紐解くデータマネジメント
pacocat
9
1.8k
セキュリティAIエージェントの現在と未来 / PSS #2 Takumi Session
flatt_security
2
710
ブラウザ拡張のセキュリティの話 / Browser Extension Security
flatt_security
0
240
mablでリグレッションテストをデイリー実行するまで #mablExperience
bengo4com
0
450
命名から始めるSpec Driven
kuruwic
3
780
都市スケールAR制作で気をつけること
segur
0
220
TypeScript×CASLでつくるSaaSの認可 / Authz with CASL
saka2jp
2
170
Excelデータ分析で学ぶディメンショナルモデリング ~アジャイルデータモデリングへ向けて~ by @Kazaneya_PR / 20251126
kazaneya
PRO
3
780
Digitization部 紹介資料
sansan33
PRO
1
6.1k
type-challenges を全問解いたのでエッセンスと推し問題を紹介してみる
kworkdev
PRO
0
160
Databricksによるエージェント構築
taka_aki
1
100
シンプルを極める。アンチパターンなDB設計の本質
facilo_inc
1
750
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.1k
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
The Language of Interfaces
destraynor
162
25k
Building an army of robots
kneath
306
46k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
GraphQLとの向き合い方2022年版
quramy
49
14k
A better future with KSS
kneath
240
18k
How to Ace a Technical Interview
jacobian
280
24k
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Optimizing for Happiness
mojombo
379
70k
Transcript
検索エンジン自作入門 手を動かしながら見渡す検索の舞台裏 Masanori Ogino DoC on 2021-09-25
Table of Contents 1. 今回紹介する本 2. 読もうと思ったきっかけ 3. 感想 4.
おすすめポイント 1
今回紹介する本
今回紹介する本 題 検索エンジン自作入門 著 山田浩之、末永匡a 頁 224 ページ 年 2014
年 版 技術評論社 PDF EPUB aニコニコ周辺文化に親しんだ人なら 「グニャラくん」の方がピンと来るかも。 2
今回紹介する本 DRM1 1各ページにユーザ名とメールアドレスの透かしが入っている。 こうしたデッドコピー流通抑止手法を social DRM と呼ぶ場合もあるが、 今回は DRM として扱わないものとする。
3
今回紹介する本 Figure 1: The official video of Drake, “Hotline Bling”.
https://www.youtube.com/watch?v=uxpDa-c-4Mc 4
読もうと思ったきっかけ
読もうと思ったきっかけ • Google の検索結果がイマイチ、でも Bing2も…… • プライバシー:DuckDuckGo は本当に信頼できるのか? • DDG
がダメなら Startpage? Searx セルフホスト? 「どうちがうの? 同じようなものじゃない。 もっとホンシツを見ようよ、なるほどくん。 」 —— 綾里真宵 2検索結果上位 5 件が広告だったときは流石にいかがなものかと 思った。 5
読もうと思ったきっかけ メタサーチエンジンで検索の質を向上できるのか? Big Tech のリソースなしには、もはや Web 検索を実現する ことはできないのか? Web 全体を網羅することはできないにしても、
“十分良い” 検索エンジンを作るのは可能なのではないか? 6
感想
感想 • 難易度はやさしめ • ただし、プログラミング入門は済ませている前提 • 手を動かしながら読むのによい本 • 私は C++と
TypeScript で少しずつ書き進めている • アルゴリズムの種類は絞り気味 • 本格的な専門書に進む前の一冊目として 7
おすすめポイント
おすすめポイント • 自然言語処理の前提知識は不要 • サンプルコードが本文にベタ貼りされてない (サポートページからダウンロードすること) • 永続化を SQLite に任せている
• 索引に注力してデータ構造や永続化を省く割り切り 8