データ同期の流れ
Glueを使った流れは以下の通り
1. データベースからデータをクロールする
2. クロールしたらデータカタログにメタデータを管理する
3. データカタログのメタデータを元にデータソースからデータを抽出する
4. ジョブを実行してターゲットにデータを同期する
①
②
③ ④
Glue Jobの設定
Data Catalog
Data Integration and ETL
インデックスとは?
● データを検索エンジンで検索するためには,“index” の作成が必要
○ An index is like a ‘database' in a relational database.
It has a mapping which defines multiple types.
○ An index is a collection of documents that are
related to each other.
● インデックス化は,検索エンジンが高速に検索できるよう
にデータを整理する方法
Ref.
1. What is an Elasticsearch Index?
2. What is Elasticsearch?