Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon RDS for PostgreSQL deep dive 〜 Amazon Redshiftとの連携 〜

con_mame
November 12, 2016

Amazon RDS for PostgreSQL deep dive 〜 Amazon Redshiftとの連携 〜

JPUG新潟で発表した資料です

con_mame

November 12, 2016
Tweet

More Decks by con_mame

Other Decks in Technology

Transcript

  1. Amazon RDS for PostgreSQL deep dive 〜 Amazon Redshiftとの連携 〜

    Amazon Web Services Japan K.K. Solutions Architect 星野 豊
  2. マネージド・サービスを使う理由 • DBA (DataBase Administrator)の仕事 1. スキーマやクエリのチューニング • DBの構造を理解した上での、適切な改善 2.

    DBサーバ/クラスタの管理 • 構築、キャパシティ、パフォーマンス、障害対応 • 現在、どちらに費やしている時間が多い?
  3. AWSのデータベースサービス群の特徴: マネージド • インスタンスの管理が不要 – sshログイン等は不可能、構築から設定まで全てマネージド • 使った分だけの料⾦体系 – 稼働時間、容量、スループット、IO等

    • ⾼可⽤性 – Multi AZで⾃動フェイルオーバーや、データ冗⻑化 • バックアップ可能なものは標準で⾃動的に取得 • ログやメトリクスの収集、可視化も⾃動
  4. AWSが提供するデータベースサービス 完全マネージド型で、セットアップ、運⽤、拡張が 容易なリレーショナル・データベースサービス Amazon RDS Amazon DynamoDB 完全マネージド型で、⾼速なパフォーマンス、 シームレスな拡張性と信頼性をNoSQLサービス Amazon

    Redshift ⾼速で管理も万全なペタバイト規模のデータウェア ハウスサービス Amazon ElastiCache 完全マネージド型で、セットアップ、運⽤、拡張が容 易なキャッシュサービス
  5. オンプレミス vs. データベース on EC2 vs. RDS Power, HVAC, net

    Rack & stack Server maintenance OS patches DB s/w patches Database backups Scaling High availability DB s/w installs OS installation App optimization Power, HVAC, net Rack & stack Server maintenance OS patches DB s/w patches Database backups Scaling High availability DB s/w installs OS installation App optimization Power, HVAC, net Rack & stack Server maintenance OS patches DB s/w patches Database backups Scaling High availability DB s/w installs OS installation App optimization オンプレミス データベース on EC2 RDS お客様がご担当する作業 AWSが提供するマネージド機能
  6. Amazon RDS: インスタンスタイプが豊富 8GB 16GB 32GB 60GB 122GB 244GB 4core

    8core 16core 32core r3.8xl 2core 1core r3.4xl r3.2xl r3.xl r3.large m4.2xl m4.xl m4.large 4GB t2.small t2.micro t2.medium 1GB Memory vCPU m4.4xl m4.4xl 40core
  7. DBインスタンスクラスとスペック DB Instance Class vCPU メモリ(GiB) EBS 最適化 ネットワーク db.t2.micro

    1 1 無し 低 db.t2.small 1 2 無し 低 db.t2.medium 2 4 無し 低 db.t2.large 2 8 無し 中 db.m4.large 2 8 450Mbps 中 db.m4.xlarge 4 16 750Mbps ⾼ db.m4.2xlarge 8 32 1000Mbps ⾼ db.m4.4xlarge 16 64 2000Mbps ⾼ db.m4.10xlarge 40 160 4000Mbps 10Gbps db.r3.large 2 15 無し 中 db.r3.xlarge 4 30.5 500Mbps 中 db.r3.2xlarge 8 61 1000Mbps 中 db.r3.4xlarge 16 122 2000Mbps ⾼ db.r3.8xlarge 32 244 (n/a) 10Gbps ※表には記載していない旧世代インスタンスも選択可能です
  8. RDSで使⽤できるディスクボリュームタイプ 項⽬ 標準(Standard) Magnetic General Purpose (GP2) プロビジョンド IOPS (PIOPS)

    種類 ハードディスク SSDベース SSDベース 容量課⾦ あり(GBあたり) あり(GBあたり) あり(GBあたり) IOPS キャパシティ課⾦ なし なし あり(プロビジョニングされた IOPS単位) IOリクエスト課⾦ あり なし なし 性能 平均100IOPS〜 最⼤数百IOPS (サイズに依存する) ⾼性能+バースト 最⼤3000IOPS(以上) (ベースパフォーマンス+ バースト) ⾼性能 1,000〜30,000 IOPS (PIOPS設定を保証) • 標準、General Purpose(GP2)、プロビジョンドIOPSから選択 • オンラインでサイズ増加可能(※SQL Server以外) http://docs.aws.amazon.com/ja_jp/AmazonRDS/latest/UserGuide/CHAP_Storage.html
  9. プロビジョンドIOPS ストレージの注意点 • IOPSについての注意点 – 各DBエンジンの仕様、Page Sizeや仮想化技術の違いで実際のIOPSは以下の表 のような⽬安になる – ⼩さなインスタンスタイプではストレージとの帯域不⾜で設定したIOPSに達し

    ない場合がある(EBS最適化ありのインスタンスを推奨) DBエンジン (最⼤サイズ、IOPS) Page Size Max IOPS PostgreSQL(6TB, 30,000) 8KB 30,000 MySQL / MariaDB (6TB, 30,000) 16KB 30,000 Oracle(6TB, 30,000) 8KB 25,000 SQL Server(4TB, 20,000) 8KB 20,000 ※ Read 50%, Write 50%の場合
  10. RDSでデータベースを作成するのは簡単 • 数クリックでDBが起動 – DBエンジン – インスタンスクラス – ディスクの種類とサイズ 等を選ぶだけ

    • 必須機能が実装済み – バックアップ(スナップショット) • ⾃動バックアップ • ⼿動バックアップ – 同期レプリケーションよる可⽤性向上 – 監視 (CloudWatch) – 管理GUIやAPIで操作可能
  11. RDSアーキテクチャ ⾃動バック アップ スナップシ ョット (⾃動/⼿動) データ同期 ⾮同期レプリケーション ⾃動フェイルオーバー Binlog

    (トランザクション ログ) (5分間隔) トランザクション ログ 5分に1度保存 S3 Availability Zone A Availability Zone B リードレプリカ Multi-AZ
  12. マルチAZデプロイメントとは(Multi-AZ) • ワンクリックで耐障害性を向上可能なソリューション – ⾼い技術⼒を持つDBAが⾏っていた設計をそのままサービス化 – AZとはアベイラビリティゾーンの略。1つ以上のデータセンタからなる データセンタクラスタ • 同期レプリケーション+⾃動フェイルオーバ

    – アプリ側での対処は必要なし(エンドポイントは変わらない) – スタンバイ状態のDBはアクセス不可 • フェイルオーバの実施タイミング – インスタンスやハードウェア障害 – パッチ適⽤などのメンテナンス時間 – ⼿動リブート時に強制フェイルオーバー指定 http://aws.amazon.com/jp/rds/details/multi-az/ Region Multi-AZ Availability zone Availability zone
  13. リードレプリカ(RR)とは? • 読み取り専⽤のレプリカDB – 5台まで増設可能(※上限緩和申請可能) • Amazon Auroraは15台まで – マルチAZとの組み合わせも可能

    – マスター昇格 – RRのディスクタイプやインスタンスタイプをソース とは別のタイプに変更可能 • 想定ユースケース – 読み取りのスケーリング、BI等の解析処理の分散 – マルチAZによる耐障害性の代替ではない リードレプリカ APP APP 2 APP APP 読み書き ワークロード 読み取り ワークロード
  14. DBエンジンとリードレプリカへの対応 • 対応DBエンジン – MySQL – PostgreSQL – MariaDB –

    ※OracleはGolden Gateの導⼊で対応可能 • MySQL/MariaDB/PostgreSQLの機能 – クロスリージョンレプリケーション(リージョンを またいだレプリケーション) – RRのカスケード – リードレプリカ側でのスナップショット実⾏
  15. DBインスタンス暗号化機能 • 暗号化保存を実現 – ディスク上に暗号化されたデー タが保存 – AES-256 – AWS

    KMSで鍵管理が可能 • 対応インスタンスタイプ – db.m3.* / db.m4.* / db.r3.* – db.cr1.8xlarge(旧世代) • 補⾜: – インスタンス作成時のみ設定可能 (後から変更できない) – RRも同じ鍵で暗号化される
  16. ⾃動スナップショットとリストア • RDS標準機能として⾃動的なバックアップを提供 – ⾃動スナップショット+トランザクションログをS3に保存 • ⾃動スナップショット – 1⽇1回⾃動取得 (バックアップウインドウで指定した時間帯)

    – 保存期間は最⼤35⽇分 (0⽇〜35⽇の間で設定可能) – ⼿動スナップショットは任意の時間に可能 • リストア⽅法 – リストア:スナップショットを元にDBインスタンス作成 – Point-In-Time-Recovery: • 指定した時刻(5分以前)の状態になるようDBインスタンス作成
  17. 設定変更 • RDSのサーバには直接 SSHログインできない • 設定変更はパラメー ターグループ – デフォルトのひな形をコピーし て作成する

    • オプション機能の追加 はオプショングループ – TDEなど – 設定項⽬のオン・オフが多い
  18. スケールアップ機能 • マネージメントコンソールやAPIからスケール アップ可能 – インスタンスrebootを伴う – コマンドライン(AWS CLI)からも可能 •

    スケールダウンも可能 – ⼀時的に⼤きくして、その後戻すといった運⽤ – 開発DBを⽇中だけ⼤きくして使わない夜間は⼩さくする運⽤ • インスタンスの変更でCPUとメモリだけでなく ディスクIO帯域やネットワーク帯域が変更になる $ aws rds modify-db-instance \ --db-instance-identifier test-db --db-instance-class db.m3.2xlarge \ --apply-immediately スケールアップ
  19. DBエンジン ログ種別 保持期間 PostgreSQL (※ログの種別がない) 7⽇間※2 MySQL Error, Slow Query※1,

    General※1 24時間 Oracle Alert, Trace 7⽇間※2 SQL Server Error, Agent, Trace 7⽇間※2 ログアクセス機能 • 各種ログを直接参照する機能 – API経由 でダウンロード or マネジメントコンソールで表⽰ http://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_LogAccess.html ※1 パラメータグループで有効化すると⽣成 ※2 パラメータグループで期間の調整可能
  20. CloudWatch対応(監視) • 各種メトリクスを60秒間隔で取得・確認可能 – ホスト層のメトリクス(CPU, Memory Usage等 ) – ストレージのメトリクス

    (IOPS, Queue Depth等) – ネットワークのメトリクス (受信スループット、送信ス ループット等)
  21. DBエンジン – PostgreSQL - • バージョン – 9.3.1 - 9.3.12

    – 9.4.1, 9.4.4, 9.4.5, 9.4.7 – 9.5.2, 9.5.4 – 9.6.1 – 9.3→9.4, 9.4→9.5, 9.5→9.6へのバージョンアップ に対応 • 特徴的な機能 – 多くの拡張モジュールを利⽤可能 – PostGISをRDSオリジナルの拡張モジュールとして提供 => SHOW rds.extensions; (導入済モジュール一覧) => CREATE EXTENSION [拡張モジュール名];(登録して利用可能に)
  22. 拡張モジュール(⼀部) btree_gin earthdistance pgrowlocks sslinfo btree_gist fuzzystrmatch pg_trgm tablefunc chkpass

    hstore plperl tsearch2 citext intagg plpgsql unaccent cube intarray pltcl uuid-ossp dblink isn postgis plv8 dict_int ltree postgis_tiger_geocoder postgres_fdw dict_xsyn pgcrypto postgis_topology pg_stat_statements ⼿続き⾔語(ストアド プロシージャ) GIS (地理情報システ ム) オブジェクト データを暗号/複合化 • 拡張モジュール詳細は以下を参照 http://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/CHAP_PostgreSQL.html 実⾏されたSQLの統計 情報を記録
  23. 新Extensionサポート • RDS for PostgreSQL: 新Extensionサポート (PostgreSQL9.4.5以上) – ip4r -

    単⼀のIPv4アドレスから任意の範囲のIPv4やIPv6のアド レス帯に及ぶIPアドレスデータ型をサポート – pg_buffercache - 共有バッファキャッシュで何が起きているか をリアルタイムに確認する⽅法を提供 – pgstattuple - リレーションの物理的な⻑さ、バキュームが必要 かどうか決定するのに役⽴つ"不要"なタプルの割合などのタプ ルレベルの統計情報を⼊⼿するための各種関数を提供
  24. 新パラメータサポート • RDS for PostgreSQL: 新しく3つのパラメータを サポート – rds.force_admin_logging_level -RDSのインターナルユーザー

    (rds_admin)によるDBインスタンス内での操作を記録し、 PostgreSQLのエラーログに出⼒ – rds.force_autovacuum_logging_level - autovacuum workerに よるDBインスタンス内の全データベースでの操作を記録し、 PostgreSQLのエラーログに出⼒ – rds.rds_superuser_reserved_connections - PostgreSQLの スーパーユーザーに設定できるように、rds_superuserによる接 続を予約 (PostgreSQL9.4.5以上)
  25. 最新アップデート • ロジカルレプリケーション – RDS for PostgreSQLがロジカルレプ リケーションに対応 • DMSサポート

    – ロジカルレプリケーション機能によりRDS for PostgreSQLデータベースインスタンスをAWS Database Migration Serviceのソースデータベースとして利⽤可能 • Event Trigger – 新しいバージョンのPostgreSQLでデータベースイ ンスタンスレベルでevent triggerをサポート • RAM Disk Size – RDS for PostgreSQLでRAM diskのサイズをコン トロール可能になりました
  26. 拡張モニタリング 50+ system/OS metrics | sorted process list view |

    1–60 sec granularity alarms on specific metrics | egress to Amazon CloudWatch Logs | integration with third-party tools
  27. 重要なシステム/OSメトリクスに対応 User System Wait IRQ Idle CPU Utilization Rx per

    declared ethn Tx per declared ethn Network Num processes Num interruptible Num non-interruptible Num zombie Processes Process ID Process name VSS Res Mem % consumed CPU % used CPU time Parent ID Process List MemTotal MemFree Buffers Cached SwapCached Active Inactive SwapTotal SwapFree Dirty Writeback Mapped Slab Memory TPS Blk_read Blk_wrtn read_kb read_IOs read_size write_kb write_IOs write_size avg_rw_size avg_queue_len Device IO Free capacity Used % Used File System
  28. Amazon Redshiftの概要 • クラウド上のDWH – 数クリックで起動 – 使った分だけの⽀払い • ⾼いパフォーマンス

    – ハイ・スケーラビリティ • ⾼い汎⽤性 – PostgreSQL互換のSQL – 多くのBIツールがサポート
  29. ノードタイプ • SSDベースのDCとHDDベースのDSから選択 – データは圧縮されて格納されるため、ストレージ総量より多くのデータが格納可能 • 最⼤128ノード:2PByteまで拡張可能 – ノードタイプと数は後から変更可能 DC1

    - Dense Compute vCPU メモリ(GB) ストレージ ノード数 価格(※) dc1.large 2 15 0.16TB SSD 1~32 $0.314 /1時間 dc1.8xlarge 32 244 2.56TB SSD 2~128 $6.095 /1時間 DS2 – Dense Storage ds2.xlarge 4 31 2TB HDD 1~32 $1.190 /1時間 ds2.8xlarge 36 244 16TB HDD 2~128 $9.520 /1時間 ※価格は東京リージョンにおいて2016年11月12日時点のものです
  30. Amazon Redshiftの位置づけ データ・ストアの特性に応じた使い分け Amazon DynamoDB Amazon RDS Amazon ElastiCache Amazon

    Redshift SQL NoSQL • 低レンテンシ • インメモリ • 3拠点間での レプリケーション • SSDに永続化 • トランザク ション処理 • 汎⽤⽤途 • 集計・分析処理 • ⼤容量データ • DWH
  31. Redshiftの構成 SELECT * FROM lineitem; SQLをコンパイル、 コードを⽣成し、コン ピュートノードへ配信 CPU CPU

    CPU CPU CPU CPU Leaderノード Computeノード スライス= メモリとディスクを ノード内で分割した論 理的な処理単位 コンピュートノードの追 加でパフォーマンス向上 (スケールアウト) 1つの表を各ノード のストレージに分散 して保存(シェアー ドナッシング)
  32. 列指向型(カラムナ) DB ・⾏指向型(他RDBMS) ・列指向型(Redshift) orderid name price 1 Book 100

    2 Pen 50 … n Eraser 70 orderid name price 1 Book 100 2 Pen 50 … n Eraser 70 DWH用途に適した格納方法
  33. ワークロードの違いを吸収 • Amazon RedshiftはMPP、シェアードナッシング のアーキテクチャ – 1つのクエリを実⾏する際にも多くのノードをまたがってコン ピュートリソースを使⽤する – ⼤量のデータに対して分析するクエリ

    • OLTP型データベースは各クエリの処理に1つのサー バ上の部分的なリソースしか使⽤しない – 多くのOLTP型データベースはより多くの並列クエリを処理できる – 各クエリごとに消費するリソースをできるだけ⼩さくし、効率的に 実⾏できるように設計されている
  34. 連携するには • postgres_fdw – foreign-data wrapper – postgres_fdwモジュールは外部テーブルの作成を可能にする。外 部テーブルはローカルにあるネイティブのテーブルと同じようにク エリ可能

    – 現時点では、 アグリゲーション関数やLIMIT句等をリモートに プッシュダウン出来ないため、クエリは全てがリモート側で実⾏さ れるわけではない – 外部テーブルに対してアグリゲーションクエリを実⾏した場合、ア グリゲーションを実⾏するために必要な全データが⼀旦 PostgreSQLに全て転送され、多くの⾏を操作する場合に実⾏速度 が低下
  35. 実際に使うには • AWS上ではとても簡単に構築しテストを⾏うこと が可能 • Amazon Redshiftを起動 • RDS PostgreSQL

    (9.5以降)をAmazon Redshiftと 同じAZに起動 • Amazon RedshiftへRDS for PostgreSQLインスタ ンスからアクセス出来るようにアクセス制限を設定
  36. 後は接続するだけ! • 先程作成したAmazon Redshiftのエンドポイントを確 認して、同じく作成したRDS for PostgreSQLへ接続し 以下のクエリを実⾏ CREATE EXTENSION

    postgres_fdw; CREATE EXTENSION dblink; CREATE SERVER foreign_server FOREIGN DATA WRAPPER postgres_fdw OPTIONS (host '<amazon_redshift _ip>', port '<port>', dbname '<database_name>', sslmode 'require'); CREATE USER MAPPING FOR <rds_postgresql_username> SERVER foreign_server OPTIONS (user '<amazon_redshift_username>', password '<password>');
  37. クエリを実⾏! • dbLinkの設定が完了すれば後はクエリを実⾏す るだけ! SELECT * FROM dblink('foreign_server',$REDSHIFT$ SELECT sellerid,

    sum(pricepaid) sales FROM sales WHERE saletime >= '2008-01-01' AND saletime < '2008-02-01' GROUP BY sellerid ORDER BY sales DESC $REDSHIFT$) AS t1 (sellerid int, sales decimal);
  38. 様々なクエリを実⾏ • VIEW – SQLをより楽に書けるように VIEWを定義 CREATE OR REPLACE VIEW

    v_sales AS SELECT * FROM dblink ('foreign_server',$REDSHIFT$ SELECT sellerid, sum(pricepaid) sales FROM sales WHERE saletime >= '2008-01-01' AND saletime < '2008-02-01' GROUP BY sellerid ORDER BY sales DESC $REDSHIFT$) AS t1 (sellerid int, sales decimal);
  39. 様々なクエリを実⾏ • UDF – UDFは使⽤時 にパラメータ を渡すことが 可能 – PL/pgSQLで

    PostgreSQL内 にUDFを作成 CREATE OR REPLACE FUNCTION get_sales(_startdate timestamp, _enddate timestamp) RETURNS TABLE (sellerid int, sales decimal) AS $BODY$ DECLARE remote_sql TEXT; BEGIN remote_sql = FORMAT( ' SELECT sellerid, sum(pricepaid) sales FROM sales WHERE saletime >= %L AND saletime < %L GROUP BY sellerid ORDER BY sales DESC ', _startdate, _enddate); RETURN QUERY SELECT * FROM dblink('foreign_server', remote_sql) AS t1 (sellerid int, sales decimal); END; $BODY$ LANGUAGE plpgsql VOLATILE;
  40. 定期的にリフレッシュしたい場合は? • アプリケーションやバッチから実⾏ – そのためにサーバを起動しておくのも… • AWS Lambdaを利⽤すれば安価に実⾏できサーバのメンテナンスも不要 var pg

    = require("pg"); exports.handler = function(event, context) { var conn = "pg://username:password@host:port/dbname"; var client = new pg.Client(conn); client.connect(function(err) { if (err) { context.fail("Failed" + err); } client.query('REFRESH MATERIALIZED VIEW v_users_likes_by_state', function (err, result) { if (err) { context.fail("Failed to run query" + err); } client.end(); context.succeed("Successfully Refreshed."); }); }); };
  41. その他の使い⽅ • dblink関数を利⽤してデータを表にインサートする⽅法 • 以下のように差分でデータをインサートすることで、マテリアライ ズド・ビュー全体をリフレッシュするよりも⾼速に更新を⾏う INSERT INTO sales_summary SELECT

    * FROM dblink('foreign_server',$REDSHIFT$ SELECT date_trunc('hours', saletime) AS ts, sellerid, sum(pricepaid) sales FROM sales WHERE saletime >= '2008-01-01' AND saletime < '2008-02-01' GROUP BY ts, sellerid ORDER BY sales $REDSHIFT$) AS t1 (saletime timestamp, sellerid int, sales decimal);
  42. pgbouncer-rr • pgbouncer-rr – https://github.com/awslabs/pgbouncer-rr-patch – Pgbouncerベース – コネクションプール •

    その他にも⼤きな機能 – Routing: クライアントからのクエリを⾃動的にロードバランシングをし たり、1コネクションで複数のデータベースサーバに接続を⾏う – Rewrite: データベースサーバにクエリを送信する前に書き換えを⾏う • Amazon Redshift向けで無いようなクエリを書き換えて最適化 • ⼀定数以上のデータ(N⽇以上など)をクエリしようとした場合にエラーをだす
  43. 注意点 • テーブル名やスキーマ名を⾒てルーティングが⾏われる • データベース間のjoinやトランザクションはサポートしてい ない • クエリは各ステートメントでauto-commit – pool_mode

    = statement • 複数のクエリでなるトランザクションでも、トランザクショ ン中に他のサーバにルーティングされなければ動作可能 – pool_mode = transaction
  44. Routingルール • データベース情報の設定 [databases] dev = host= port=5439 dbname=dev dev.1

    = host= port=5439 dbname=dev dev.2 = host= port=5439 dbname=dev • ルーティングルールの設定 – routing_rules_py_module_file = /etc/pgbouncer-rr/routing_rules.py (動的に読み込まれる) def routing_rules(username, query): if "tablea" in query: return "dev.1” elif "tableb" in query: return "dev.2” else: return None #現在のコネクションの接続先データベースを利用
  45. 応⽤編 • 正規表現も利⽤可能 • Pythonでロジックを書 いて振り分け – 外部のデータベースにルール を保存しておき利⽤可能 –

    AWSならDynamoDBに保存し boto3を使い連携 routingtable = { 'route' : [{ 'usernameRegex' : '.*', 'queryRegex' : '.*tablea.*', 'dbkey' : 'dev.1' }, { 'usernameRegex' : '.*', 'queryRegex' : '.*tableb.*', 'dbkey' : 'dev.2' } ], 'default' : None } import re def routing_rules(username, query): for route in routingtable['route']: u = re.compile(route['usernameRegex']) q = re.compile(route['queryRegex']) if u.search(username) and q.search(query): return route['dbkey'] return routingtable['default']
  46. AWS Database Migration Service(DMS) • RDB間のデータ移⾏を⽀援 するサービス • 異機種間のデータ移⾏も対応 •

    利⽤が容易 • 使った分だけの料⾦体系 DMS オンプレ RDB RDS RDB on EC2 オンプレ RDB RDS RDB on EC2 ※オンプレ to オンプレは未サポート
  47. サポートするデータベース ソース ターゲット Oracle on-prem/EC2 10g, 11g, 12c Ent/SE/SEone 10g,

    11g, 12c Ent/SE/SEone RDS 11g, 12c Ent/SE/SEone 11g, 12c Ent/SE/SEone MySQL on-prem/EC2 5.5, 5.6 5.5, 5.6 RDS 5.5, 5.6 5.5, 5.6 PostgreSQL on-prem/EC2 9.4 9.3以降 RDS 9.4 9.3以降 SQL Server on-prem/EC2 2005, 2008, 2008R2, 2012, 2014 Ent, Std, Workgroup, Developer 2005, 2008, 2008R2, 2012, 2014 Ent, Std, Workgroup, Developer RDS 2008R2, 2012, 2014 Ent, Std, Workgroup, Developer ※1 2008R2, 2012, 2014 Ent, Std, Workgroup, Developer Aurora RDS MySQL互換としてサポート MySQL互換としてサポート ※1:CDC利用不可
  48. レプリケーションの⽅法 • Migrate existing data(フルロード) • DMSがソースDBから対象表のデータを読み取る • ターゲットDBにデータをロードする •

    Replicate ongoing changes(CDC) • DMSがソースDBのトランザクションログから更新差分を抽出 • 継続的にターゲット表にアプライする • ソースDBへの負荷が低いレプリケーションを実現 • 表全体をフルロードした後に、継続的にCDCも可能
  49. 移⾏対象 • 表定義 • インデックス定義 • データ • 制約(⼀部) DMSが移⾏するもの

    移⾏しないもの • ビュー • プロシージャ • トリガー • シノニム • 制約 – 参照制約やユニーク制約
  50. AWS Schema Conversion Tool(SCT) • 異なるRDB間での移⾏時に各種オブジェクトの移⾏ (変換)を補助するツール – Windows, Mac,

    Linuxにダウンロードして利⽤ • 移⾏対象 – 表、インデックス、トリガー、プロシージャ – 制約、ビュー • SCTが⾃動変換した型が最適とは限らないので、業 務に合わせた微調整は必要