Slide 1

Slide 1 text

໊ࢗσʔλԽγεςϜʹ͓͚Δ AWSͱGCPͷ ϚϧνΫϥ΢υ׆༻΁ͷ௅ઓ

Slide 2

Slide 2 text

େᖒ लҰ(Shuichi Ohsawa) • !PITBXB • ٕज़ϒϩά IUUQTCMPHKJDPNBOJOGP • ݩ1)1FSɻ࠷ۙ(PݴޠͰπʔϧ։ൃ • Yࡀɻݟͨ໨೥ྸ  Data Strategy & Operation Center Development Group ΠϯϑϥΤϯδχΞ

Slide 3

Slide 3 text

Twitterハッシュタグ #SBB ηογϣϯͷײ૝(Α͔ͬͨʂͱ͔) ϚαΧϦ(༏ͯ͘͠͠Ͷ) ฉ͖͔ͨͬͨ͜ͱ(࠙਌ձͰ) ͲΜͲΜπΠʔτ͍ͯͩ͘͠͞ʂʂ

Slide 4

Slide 4 text

Sansan Builders Box 本⽇のゴール AWSͱGCP྆ํͷಛ௃Λ஌ͬͯ ༗ޮ׆༻͢ΔͨΊͷώϯτΛ ࣋ͪؼͬͯ΋Β͏

Slide 5

Slide 5 text

Sansan Builders Box - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - 各クラウドの特徴 - まとめ Agenda

Slide 6

Slide 6 text

Sansan Builders Box 名刺データ化システム(GEES) ໊ࢗը૾ ໊ࢗσʔλ ໊ࢗσʔλ ࣗಈೖྗ ΦϖϨʔλ ໊ࢗը૾

Slide 7

Slide 7 text

Sansan Builders Box Architecture VPN Gateway NAT ZONE Compute Engine Autoscaling Cloud Load Balancing ZONE Compute Engine Autoscaling VPC NAT gateway VPN Gateway VPN Connection Web Application Batch Processing DB Data Processing AWS Cloud Stackdriver Logging Vision API

Slide 8

Slide 8 text

Sansan Builders Box • マネージドサービスを積極的に活⽤ • 3層アーキテクチャ + バッチ • オペレータ⽤⼊⼒サイト • ⾃動化API (OCR含む) • EC2がメイン、ECS、AWS Batchも増えている • データベースは基本的にAurora。⽤途に応じて Redshift、 DynamoDB、 CloudSearch • データ化フローの制御にSimple Workflow (SWF)を利⽤ AWS VPC VPN Gateway Web Application Batch Processing DB Data Processing AWS Cloud NAT gateway

Slide 9

Slide 9 text

Sansan Builders Box GCP • 名刺画像データのOCR処理プロセスの中で Cloud Vision APIを採⽤ • データ⾃動化を担うAPIサービスの⼀部をGCPに移⾏ • HTTP Load Balancer + GCE • ⾼速にレスポンスを返すよくあるAPIではない • 画像データを解析した結果を返すのでマシン リソースを⼤量に消費する • c4.8xlarge(36 vCPU) で 0.8 RPS/台程度 • レスポンスタイム ⼗数秒 VPN Gateway NAT ZONE Compute Engine Autoscaling Cloud Load Balancing ZONE Compute Engine Autoscaling Stackdriver Logging Vision API

Slide 10

Slide 10 text

Sansan Builders Box • Stackdriver Loggingによるログ収集、GCSによる⻑期保管 • Cloud Audit Logging: GCPにおける操作履歴 • VPC Flow Logs: ネットワークトラフィックをキャプチャ • Linuxのauditd, Windowsのイベントログ • Loggingエージェントでログをパース • アプリケーションログはAWS側にあるFluentdサーバに送信 • AWS NLB + FluentdにVPN経由で送信 Logging on GCP

Slide 11

Slide 11 text

Sansan Builders Box • クラウド間の通信はインターネット経由(HTTPS)とVPNを併⽤ • AWS VPNの上限 (最⼤ 1.25 Gbps)を考慮 • VPNはDBなどのプライベート接続なやログ転送に利⽤ • APIへのPOST(画像データ)はインターネット経由 Data Transfer

Slide 12

Slide 12 text

Sansan Builders Box • VPCからインターネットへのアウトバウンドに対して コストが発⽣する • アウトバウンドのデータ量を減らす • 画像をJPEGからWebPに変更(50%圧縮) • JSONからMessagePackに変更(75%圧縮) • AWSのデータ転送料⾦が約30%下がったのが追い⾵に クラウド間のデータ転送に注意する

Slide 13

Slide 13 text

Sansan Builders Box Agenda - 名刺データ化システムとアーキテクチャ - AWS͔ΒGCP΁ͷҠߦ - 各クラウドの特徴 - まとめ

Slide 14

Slide 14 text

Sansan Builders Box • CloudEndureを使ってEC2からGCEに移⾏ • エージェントによるレプリケーションでリアルタイム同期 • EC2とGCEでいくつか設定が異なるので注意が必要 • できることなら⼀からプロビジョニングしたほうが早い VMマイグレーション

Slide 15

Slide 15 text

Sansan Builders Box • 通常のGCEとプリエンプティブVMのインスタンスグループを作成 • プリエンプティブVMを有効活⽤してコストダウン • CPU使⽤率ではなくスループット(RPS)によるスケーリング • アプリケーションの性能に即した形 • AWSにあってGCPにない機能はツール⾃作でカバー • スケジュールベースのスケーリング • Cloud Schedulerがリリースされたので移⾏する予定 Auto Scaling

Slide 16

Slide 16 text

Sansan Builders Box Agenda - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - ֤Ϋϥ΢υͷಛ௃ - まとめ

Slide 17

Slide 17 text

Sansan Builders Box • AWS • ユースケースに合わせたインスタンスタイプ • コンピューティング最適(C5), メモリ最適(R5, X1), GPUインスタンス(P3, G3) etc • CPU、メモリが決められている • GCP • カスタムマシンタイプによる柔軟性 • CPU性能が画⼀的。CPUバウンドな処理だとスループットが厳しくなる ことも • 起動時間が早い ※ Linuxの場合 Compute Engine

Slide 18

Slide 18 text

Sansan Builders Box • AWS • マルチリージョンの敷居が若⼲⾼い • リージョン限定したい場合は安⼼感がある • VPNの帯域に注意する • GCP • マルチリージョンの敷居が低い • リージョン限定したい場合は注意が必要 • VPNの拡張性が⾼い Networking

Slide 19

Slide 19 text

Sansan Builders Box • AWS • シンプルで使いやすい • バックエンドインスタンスの負荷を⾒ていい具合に分散する • GCP • 必要な設定要素がおおく、やや難しい • プレウォーミング不要 • 複数のリージョン間へのリクエストを⾃動的に割り振る • バックエンドにGCSも可能(画像やCSS, JSなど静的コンテンツに便利) • ゾーン内のインスタンスへの分散はラウンドロビンで均⼀ Load Balancer

Slide 20

Slide 20 text

Sansan Builders Box • AWS • εϙοτΠϯελϯε: EC2のキャパシティに応じて最⼤90%割引 • εϙοτϑϦʔτ: キャパシティ指定していい具合にスポットを活⽤ • ϦβʔϒυΠϯελϯε(RI): 前払いなし、⼀部前払い、全額前払い • コンバーチブルRI だとインスタンスタイプの変更も可能 • ⼀括請求に紐付けることで他のAWSアカウントも割引が効く • GCP • ϓϦΤϯϓςΟϒVM: 80%近くの割引。値段固定 • ܧଓར༻ׂҾ: 起動時間に応じて⾃動的に割引。⻑時間稼働へのコスト削減 • ֬໿ར༻ׂҾ: CPUとメモリをコミットすることで割引。前払いなし Pricing

Slide 21

Slide 21 text

Sansan Builders Box • AWS • σʔλอଘ࣌ͷ҉߸Խ: 新規作成時に暗号化設定する必要がある • ⾮暗号化から暗号化への変更が難しいものもある • Ϣʔβݖݶ(IAM):グループ機能のサポート、細かい制御が可能 • GCP • σʔλอଘ࣌ͷ҉߸Խ: 全サービスがデフォルトで暗号化される • Ϣʔβݖݶ(IAM): グルーピングや細かい作業が難しい • 最近β版がリリースされたがまだまだ機能として不⼗分 Security

Slide 22

Slide 22 text

Sansan Builders Box - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - 各クラウドの特徴 - ·ͱΊ Agenda

Slide 23

Slide 23 text

Sansan Builders Box 本⽇のゴール(再掲) AWSͱGCP྆ํͷಛ௃Λ஌ͬͯ ༗ޮ׆༻͢ΔͨΊͷώϯτΛ ࣋ͪؼͬͯ΋Β͏

Slide 24

Slide 24 text

No content