Slide 18
Slide 18 text
各技術要素の選定理由
● AWS DMS Serverless
○ マルチAWSアカウントでのデータ同期が可能であった
○ CDCでElasticsearchに同期が必要なデータ更新を確実に捕捉することができた
○ EC2インスタンスを自前で保守する必要がなかった
● Amazon Kinesis Data Streams On-Demand
○ DMS経由のCDCをストリームとして処理したかった
○ DMS以外からのデータ同期が必要になった場合の拡張性を考慮
○ 時間指定でストリームを再取得することができるため、障害復旧が容易
● AWS Fargate
○ 必要最小限の構成で実現したかった(EMR等の学習、運用コストを避けたかった)
■ 流量がある程度安定しているため動的なスケーリングが必要なかった
■ 結果整合性を担保すればよかった(チェックポイントによる厳密な再実行の仕組み等は不要)
● Apache Flink
○ 社内で使える技術者が多いJVM系の言語で開発したかった
○ 候補としてはApache Flink, Apache Beam, Apache Spark
○ Flinkで書いたコードが読みやすかった
○ Flinkがストリーミング処理由来のフレームワーク
で、window処理に関する機能が豊富そうだった