Slide 16
Slide 16 text
実例:ログの処理の例
schema.yml
version: 2
sources:
- name: log
tables:
- name: nginx_access_logs
description: nginxのアクセスログ
columns:
- name: time
description: アクセス時刻
- name: method
description: リクエストメソッド
- name: uri
description: リクエストされた URI
- name: protocol
description: リクエストのプロトコル
- name: status
description: レスポンスステータスコード
- name: vhost
description: リクエストされたホスト名
- name: request_id
description: リクエストID
- name: partition_date
description: ログ読み出しのパーティション
● 初回実行時は全行ロード
● 2回目以降は直近7日の未ロードのみ
※Redshift Spectrumを用いて読んでいて、
重複がなく、request_idで識別できることを想定した例です。