ログモニタリングツールを自作した話

Slide 1

Slide 1 text

ログモニタリングツールを自作した話 Hiroki Takeda

Slide 2

Slide 2 text

各種サーバのログを一元的に管理し、可視化するブラウザベースのログモニタリングツールつくったもの 2

Slide 3

Slide 3 text

モチベーション • アプリ実行環境をマネージドサービスとして提供するため利用者にSSHでログイン等はさせない世界観 ⇒利用者が各種ログを管理・閲覧できる仕組みが必要 3 ①サーバにSSH $ view /var/log/xxxx.log ②viewコマンド等でログを閲覧オンプレの世界観 ①ブラウザからログを選択するだけ PaaSの世界観

Slide 4

Slide 4 text

• シンプルかつオープンをコンセプト – データストアはelasticsearch – ログ収集エージェントはbeatsシリーズのfilebeat – REST APIはSpark Framework（Java）をベースに構築 – 画面はRiot.jsをベースに構築アーキテクチャ 4 Client View HTTPS Websocket API Server REST API Data Store HTTPS HTTPS Log Agent

Slide 5

Slide 5 text

Elasticsearch構成 • 物理構成 – クラスタはプロジェクト単位 • 論理構成 – インデックス（RDBのデータベース相当）はログ収集対象の各サーバ毎、年月日単位で作成 – タイプ（RDBのデーブル相当）はログファイル単位 – ドキュメント（RDBの行相当）はログファイルの1行単位 5 Elasticsearch インデックス＝サーバ名_年月日タイプ＝ログの種類ドキュメント =ログ1行 … …

Slide 6

Slide 6 text

特徴・機能 • 認証・認可（LDAP） • 多様なログ検索 – 文字列指定検索 – 日付・時刻指定検索 – 複数ログ同時検索 • ファイルダウンロード • リアルタイムログ出力（tail –fコマンド相当） • マテリアルデザイン・レスポンシブデザイン 6

Slide 7

Slide 7 text

Demo 7

Slide 8

Slide 8 text

裏話というか細かい話（1/2） • リアルタイムのログ出力では通信コストを低くし、リアルタイム性を向上させるためWebsocketを利用 ⇒ Client⇔APIサーバは双方向通信 ⇒ ElasticsearchがWebsocket対応していないため、 APIサーバ⇔Elasticsearch間は別スレッドでポーリング • Elasticsearchのindexのサフィックス日付はUTC時刻で決定されるため、日付検索で一部のログが引っかからない ⇒ 例えば日本時間の2016/8/10の03:00に出力されたログは、 xxxx-2016.08.10ではなくxxx-2016.08.09のインデックスに格納される ⇒ 日付指定検索時に指定された日付のみでインデックスを絞るとダメ ⇒ タイムゾーンオフセットを元に指定日付の前or後1日のインデックスも検索対象に含める 8

Slide 9

Slide 9 text

裏話というか細かい話（2/2） • elasticsearchの@timestampフィールドはミリ秒までしか保持できないため、時系列表示が完全に担保できない ⇒ ログファイル自体にナノ秒まで保持させ、logstashでパースして elasticsearchに食わせるか？ ⇒ logstash使いたくないし、そもそもログ自体にナノ秒を保持できないケースもある ⇒ filebeatのoffsetを利用 • ファイル行番号表示を実現しようとするとパフォーマンスが大幅に劣化する ⇒ filebeatではログデータの行番号は連携できない仕様 ⇒ 元ファイル通りに行番号を表示しようとすると1ファイル分のドキュメントを総なめして、ドキュメントIDと行番号の紐付きをキャッシュしておく必要がある（条件検索で一部のログデータのみがヒットする場合も、連番ではなく元ファイルの行番号を表示したいため） ⇒ ログが100万行とかあるといろいろキツイ ⇒ あきらめ（とりあえずoffsetを表示） 9

Slide 10

Slide 10 text

今後やりたいこと • オーケストレーションの実現 – 対象サーバ、ファイルパス等を入力して画面をポチるとエージェント（filebeat）のインストール、設定が自動で実行 • エージェントレスな世界の実現 • ログ分析用のビューどなたか知見・アドバイスを・・・ 10