Elasticsearch クエリとスキーマ定義の細かい話

藤堂淳也 / @junya_todo クエリとスキーマ定義の細かい話＼すごい／ Elasticsearch 2015/02/13

先日、静岡の焼津へ旅行してきました資料は @junya_todo

すばらしいオーシャンビュー！資料は @junya_todo

仕事も忘れ・・？資料は @junya_todo

！！（そうだ、ES勉強会だ）資料は @junya_todo

自己紹介藤堂淳也株式会社ドワンゴ Twitter Qiita jtodo (@junya_todo) jtodo 検索チームに所属、ES勉強会は聴く側に5回
プラットフォーム事業部サービス基盤開発部汎用コアセクション

発表のテーマ Elasticsearchは検索基盤として運用しやすい 1 検索
基盤として運用しやすい理由要件に柔軟｜よく気がつく公式ドキュメント 2 要件対応｜簡単なケースフィールド追加｜データ受け入れ｜クエリ受け入れ 4 まとめ 3 要件対応｜複雑なケースクエリとスキーマ定義の細かい話｜負荷検証

の全サービスを統合する検索基盤へ移行中統合検索基盤は、Elasticsearchに支えられているこれまでは、各サービスで個別に検索を開発していた Elasticsearch 背景

Elasticsearchは要件に柔軟 ...etc  新しいコンテンツが増えたから検索のフィルタを増やしたい  他サービスのデータを増やしたいドワンゴの検索基盤は、多くのサービスと連携している当然、運用していくなかでサービス側から要望が出てくるフィールドの追加の対応が多いため、追加が楽だと運用も楽 
多様な無停止スキーマ変更の手段  RESTなので手順が書きやすい｜自動化しやすい

よく気がつく公式ドキュメント困りごとはオンラインの公式ガイドラインで調べれば大抵みつかる特に検索が便利 Elasticsearch Reference Elasticsearch - The Definitive Guide
初心者から中級者向けガイド初心者から上級者向けガイドイメージ

要件への対応｜簡単なケース

要件への対応｜簡単なケースフィールド追加データ受け入れ完了検索基盤では、フィールド追加は、以下のような手順で実施するクエリ受け入れ

フィールドの追加データ長を決める int(10), varchar(128), text index.mapper.dynamic: false { } {
} DDL 検索基盤スキーマ(json) ES Index Mysqlへ Elasticsearchへ PUT _mapping API PUT _settings API Rolling restart ALTER TABLE indexするか｜storeだけするか文字列型ならアナライザを決める検索対象なのか格納するだけなのか追加するフィールドの型を決める boolean, integer, long, float, date, string 社内製アナライザ(kuromoji移行中？) 前提として ◦ フィールド追加時に決めること

データの受け入れ ◦ データ送信フロー（niconicoの検索を支えるElasticsearch by @shoito から引用）

データの受け入れ ◦ データ送信フロー（niconicoの検索を支えるElasticsearch by @shoito から引用） Indexer  Java
api transport client で簡単に bulk API Elasticsearch  refresh_interval 15s まとまった数をキューから取り出して、indexing 1分以内反映という性能要件から

データの受け入れ ◦ データ送信フロー（niconicoの検索を支えるElasticsearch by @shoito から引用） ① ② ①
サービス側から新しいフィールドのデータを送信してもらう ② 検索基盤スキーマと比べて正しいフィールドのみElasticsearchへデプロイするとElasticsearchへIndexingが開始される

クエリの受け入れ ◦ 同様に検索基盤スキーマで管理デプロイするとElasticsearchへのクエリに含めることができるようになる ◦ 利用しているクエリ query, filter, sort, aggregations
など基本的なものだけ

クエリの受け入れ ◦ 利用しているクエリ Query match query フィルタない時に利用 filtered query フィルタある時に利用
bool query Filter term filter query filter not_analyzrdな文字列でのフィルタなど range filter and / or / not filter Sort sort / function score sort 整数、日時、not_analyzrdな文字列など Aggregations Bucketing terms aggs Metric top hits aggs max / min aggs cardinality aggs グルーピング後の件数試算

要件への対応｜簡単なケースフィールド追加データ受け入れ完了検索基盤では、フィールド追加は、以下のような手順で実施するクエリ受け入れ

要件への対応｜複雑なケース

要件への対応｜複雑なケースフィールド追加データ受け入れ完了フィールド追加のフローは同じだが、事前に調査や検証が必要になる調査要件定義検証
クエリ受け入れ事前に

様々な要件｜調査テキスト検索のノイズを減らしたい環境依存文字(Unicode)で検索したいある時点の検索結果を並べ替えつつ全件取得したいフィールドの追加についての調査クエリの受け入れについての調査

テキスト検索のノイズを減らしたい『マリオ』で検索したら『リオでカーニバルが始まりました』が引っかかったマリオ出てない！ナンデ！！起きたことノイズなので引っかからないようにしたい ↓

ドキュメントに書いてあるフレーズ検索を使うと、隣り合ったトークンの位置まで比較するので、『quick brown fox』が『quick fox』で引っかからないようにできる意訳ニココ
ニニココララボボ企企画 boolean ◦ ◦ - ◦ ◦ phrase １２３ ×  boolean – 順不同でも一致 – 位置情報不要  phrase (フレーズ検索) – 順通りで一致 – 位置情報が必須コンテンツ「ニコニココラボ企画」の場合 ⇒ phraseならノイズが減る調査例）「ニコニコラボ」でbigram検索

ただし副作用がある phraseの副作用: booleanと比べて検索時の負荷が高い全文検索の世界では一般的、フレーズ検索はパフォーマンスに影響するこれらのコストは、単語が出現する回数によって異なり、出現回数が低い単語での検索であれば、非常に高速という特徴がある

実は、それもドキュメントに書いてある Luceneのベンチマークでは、フレーズクエリは単純な term クエリの20倍遅いけど、これは termがそれほど早いということを表しているもので、フレーズ検索のコストは、この数字で見るより怖いものではない意訳負荷検証したら、その通りで、よく使われるキーワードとフィールドで負荷検証したところ、負荷は問題なかった
↓

ただ、すんなりはいかなかった Luceneのベンチマークでは、フレーズクエリは単純な term クエリの20倍遅いけど、これは termがそれほど早いということを表しているもので、フレーズ検索のコストは、この数字で見るより怖いものではない意訳けど、ステージングで試したらpositionsがないと怒られた ↓
一体なにが・・・

なんと、ドキュメントに書いてあるフレーズには位置情報が必要 index_optionsでインデックスサイズを削減してたのが原因フレーズ検索が必要なく、精密なスコア必要ないのなら、転置インデックスから、トークンの位置情報や出現数を省くことで、インデックスサイズの節約が可能その設定を行っていたが、ここで問題になった

フレーズ検索はフィールド単位で検討することにした index options 文章 ID 単語出現回数位置情報
オフセット docs ◦ freqs ◦ ◦ positions (default) ◦ ◦ ◦ offsets ◦ ◦ ◦ ◦  長文の用途を検討する – スコアに影響するか – フレーズ検索を行うか – フィールド長はどの程度か  docsが可能なら削減する – Wikipedia『アニメ』の冒頭4000文字 9.7%の削減になる * サイズはデフォルトアナライザによる計測 index optionsと転置インデックスの関係

環境依存文字(Unicode)で検索したい  ユーザーは人と違うことをやりたがる – ㋷㋜㋤㊀、ココロオ㌦  シリーズものコンテンツが多い – パート①パート⑳、実況動画のまとめ㊤㊦この手の表記ゆれの対策をすることも検索基盤として重要

やっぱり、ドキュメントに書いてある調査ドキュメントの検索に「ICU」って何気なく打ち込んだら書いてあった！！

アナライザを作らなくて済んだ elasticsearch-analysis-icu ICUを用いたES用アナライザプラグイン以下を用いてNFKC正規化を行う ICUを用いて正規化を行う正規化で要求されているキーワードと等価性のあるコンテンツを返すやったこと icu_normalyzer filterのみ、アナライザに組み込んで利用

ある時点の検索結果を並べ替えつつ全件取得したい  以下が合わなかった 1. ソートとディープページングが必要だったが、scanではソートが実現できず、要件に合わなかった 2. scrollはリアルタイムなユーザーリクエストのためのものではない  scanとは
scanは、ディープページングのコストを安くするためにソートを無効にする検索タイプ  scrollとは scrollは、ある時点のスナップショットを作成して、結果を順次返していくAPI scan & scrollでは要件を満たせなかった

細かいことでもドキュメントに書いてあるなぜできないのか、そもそも検索ってなんなのか調査が必要と思ったが、それもドキュメントに書いてある調査

1. リクエストをうけたノード（コーディネーティングノード）は、必要なデータを持つシャードに対して、from+size 件を要求する 2. 要求をうけたシャードは、from+size 件のdocidとソートに使うvalueなどを返す 3. 結果を受け取ったコーディネーティングノードは、全てをマージして、グローバルソートを行って、from～size
件のdocidを生成する from: 90, size: 10 100件ずつ 100件ずつ Query phase （Definitive Guideから引用）「scanとは」の前に検索タイプ query then fetch

1. Query phaseで生成したdocidのドキュメントを要求する 2. 要求をうけたシャードは、ドキュメントをロードしてdocidと合わせて返す 3. 全てのドキュメントがfetchされた後、クライアントに結果を返す Fetch phase 10件
合計10件合計10件「scanとは」の前に検索タイプ query then fetch （Definitive Guideから引用）

Query phase from: 1000000, size: 10 1000010件ずつ 1000010件ずつディープページングを行う度にグラフが跳ねる様子
＝負荷のため、通常検索でのディープページング提供は難しい「scanとは」の前にだからディープページングは重い

検索タイプ scanとは（私の理解） 1. Query phase同様、コーディネーティングノードが from+size 件を要求する 2. 要求をうけたシャードは、from+size 件の文章をロードして、ソートせずに返す
3. 結果を受け取ったシャードは、ソートせずにクライアントに結果を返す（このケースでは、10件要求して20件返される） from: 1000000, size: 10 10件ずつ 10件ずつソートしないのでディープページングに強い検索タイプ、という理解

＞ある時点のスナップショットを作成して、結果を順次返していくAPI search context を保持しつづける特殊なAPI。オプションに有効期限 Marvelで確認できる scrollとは

search contextで参照があたっているデータは残す必要がある merge & remove A D Segments A B
C × scrollとは ⇒ scroll中もmergeは行うが、 removeだけ停止する

Segments A B C E F ・・・ scroll中はどんどんセグメントらしき(本来削除された)ものが溜まっていくよって、リアルタイムなユーザーリクエストのためのものではない、という理解ドキュメントには、scrollは異なる構成のデータストアに大量のデータを送り込むときに使うも
のであると、最初の最初に書かれている D ＝リソース（ファイルディスクリプタなど）の消費も増えていく scrollとは（私の理解）

ある時点の検索結果を並べ替えつつ全件取得したい別のインデックスへdumpした scan & scrollでは要件を満たせなかったが、dumpで解決できたやったこと

要件への対応｜複雑なケースフィールド追加データ受け入れ完了フィールド追加のフローは同じだが、事前に調査や検証が必要になる調査要件定義検証
クエリ受け入れ事前に

複雑な要件では、調査と同時に負荷検証を行う負荷検証には、『es crasher』という自作の負荷検証ツールを使っている人によって手順やツールが違う共通して言えることは、負荷検証では、キャッシュを知ることが重要負荷検証

$ curl -XPOST localhost:9200/video/_search -d '{ "query": { "match": {
"title": { "query": "ゲーム", "type": "boolean", "operator": "AND", "boost": 5 } } } }' round took 1回目 3550 2回目 11 3回目 16 結果 round took 1回目 92 2回目 7 3回目 11 結果 (再起動後) なぜmatchクエリは、二回目の方が早いのか疑問起動直後のElasticsearchへ、matchクエリを実行したときの検索実行時間(ms) 1

検索の効率化に必要なセグメントをディスクからメモリに読みこんでいる MarvelのLUCENE MEMORYは、total.segments.memory_in_bytes を描画しており、 indices _segments APIでも確認できる二度目以降、読み込みが必要なくなり実行が早くなる再起動後は、ファイルI/OにOSのページキャッシュが使われている Marvel
なぜmatchクエリは、二回目の方が早いのか疑問 1 メモリへのセグメントの読み込みが要因

$ curl -XPOST localhost:9200/video/_search?pretty -d ' { "query": { "filtered":
{ "query": { "match": { "title": { "query": "ゲーム", "type": "boolean", "operator": "AND", "boost": 5 } } }, "filter": { "term": { "view_counter": "0" } } } }, "sort": [ { "view_counter": { "order": "desc" } } ] }' round took 1回目 75 2回目 4 3回目 4 filter のみ結果 round took 1回目 537 2回目 4 3回目 5 sort のみ結果なぜfilterやsortは、二回目の方が早いのか疑問 2 そのまま Elasticsearch へ、filter と sort を実行したときの検索実行時間(ms) 表示の都合上、同一クエリとして記載

Marvel なぜfilterやsortは、二回目の方が早いのか疑問 2 filter 句ごとに filter cache を作成している別のクエリでも、filter
句さえ同じなら、キャッシュHitする bitset で容量的にはたいしたことない filter 高速化の要因 - filter cache の生成

sort 対象フィールドごとに fielddataを作成している二度目以降、fielddataが利用されるため、高速化する別のクエリでも、ソート対象さえ同じなら、キャッシュHitするなぜfilterやsortは、二回目の方が早いのか疑問 2 sort 高速化の要因
- fielddataの生成 Marvel 容量がでかい、作り直しに時間がかかる

• ソートに限らず、広く利用される – field valuesへのアクセスを必要とする問い合わせで必要 – Aggregations、geolocation filters等のフィルタ、scriptで参照したとき・・ • 構造は非転置インデックス
– 転置インデックスは単語からdoc idを探すのは得意だけど、逆にdoc idから単語を取得するのが苦手なので、キャッシュに持つ • field valuesやシャードを跨いだGlobal ordinalsという序数を持つ – 容量は大きく、文字列フィールドだと1フィールドで500MBを超えることもある • デフォルトのフォーマットでは問い合わせ時にメモリ上に作成される – メモリに置かずかつ高速なdoc valueというフォーマットもあるが、まだデフォルトにはなってない – こちらはLUCENE 4.0で追加されたDocValuesを利用しているとのこと – デフォルトと違いIndex時に作成されるらしいなぜfilterやsortは、二回目の方が早いのか疑問 2 f i e l d d a t a とは

Segments A B C ドキュメントの更新によりキャッシュはどうなるのか疑問 3 filter cache｜fielddata は、更に細かくはセグメント単位になっている
ESのドキュメントは不変。作成や更新は新しいセグメントに積まれていく新しいセグメント (lucene flush) 3. New Query 結果をCが持ってる 1. Update Aにあった文章は削除 Cに作り直したい 2. Refresh

更新が発生しても、全てのキャッシュを作り直す必要はなく、新しいセグメントのキャッシュを追加すればよい Segments A B C ドキュメントの更新によりキャッシュはどうなるのか疑問 3 filter
cache｜fielddata は、更に細かくはセグメント単位になっている Cだけ作り直し

ドキュメントの更新によりキャッシュはどうなるのか疑問 3 refreshは、index.refresh_interval の間隔で実施デフォルトで1s index.translog.flush_threshold_sizeのサイズを超えるとflash デフォルトで200MB index.translog.flush_threshold_periodの間隔でflash デフォルトで30m
cacheを無効にすると、refresh後の問い合わせの度キャッシュが作り直される検証として、リアルな数値が必要なときは、キャッシュを無効にしないほうがいい更新の反映は、refresh, flashのタイミング

Segments 削除は文章へのマークのみ。実削除はmerge時に行われる A B C 文章1に削除マーク (lucene flush) 1. Remove
Bにあった文章1は削除 2. Refresh 1 × 2... ドキュメントの削除によりキャッシュはどうなるのか疑問 4 filter cache｜fielddata は、更に細かくはセグメント単位になっている

Segments A B C 文章1に削除マーク (lucene flush) 1. Remove Bにあった文章1は削除
2. Refresh 3. New Query ヒット対象にならない 1 × 2... ドキュメントの削除によりキャッシュはどうなるのか疑問 4 filter cache｜fielddata は、更に細かくはセグメント単位になっている削除は文章へのマークのみ。実削除はmerge時に行われるどうしてなの？

mergeされるまでは、ディスク容量も使うし、fielddataも残ることになるこのスキップのために、文章が削除されたときからスループットは低くなっていくドキュメントの削除によりキャッシュはどうなるのか疑問 4 mergeされるまで、問い合わせ時にフラグを見てスキップしてるらしいって、最近のelasticsearch blogに書いてあった！

負荷検証で心にとめていることフィルタのキャッシュを無効にしない試験前に何度か動かして温めておく更新をかけつつ複数シャードのインデックスで行う GCの検証も兼ねて30分くらい苛める実際に使われるキーワードを使うソートはランダム〆〆
〆〆〆〆〆応答時間｜CPU｜メモリ｜GCなど総合的に監視して、問題がなければ、フィールドの追加を行う

Benchmark API APIで負荷検証ができる クエリの指定 リクエスト回数や繰り返し回数 キャッシュの細かい制御 ウォーミングアップなど揃ってるので、人によって違う問題は解決できるかもこの機能は実験中で、 1.4.2では使えない
おまけ

発表のテーマ Elasticsearchは検索基盤として運用しやすい負荷検証やクエリやスキーマ定義の細かい話は、ほとんどドキュメントに書いてあること深い内容までドキュメントに記載されているので、
複雑な要件時の細かい挙動を調査しやすい要件対応にはスキーマ定義が付きまとうが、 Elasticsearchはフィールド追加の対応が、とても楽まとめ

ご清聴、ありがとうございました。ご質問やご指摘ございましたら、頑張って答えます。

企業PR • たぶん、本物のエンジニアを募集してる • ブラック働きとかない、自由な社風 • 詳しくはホームページを見てください

Elasticsearch クエリとスキーマ定義の細かい話

Elasticsearch クエリとスキーマ定義の細かい話

Other Decks in Technology

Featured

Transcript