×
Copy
Open
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
໊σʔλԽγεςϜʹ͓͚Δ AWSͱGCPͷ ϚϧνΫϥυ׆༻ͷઓ
Slide 2
Slide 2 text
େᖒ लҰ(Shuichi Ohsawa) • !PITBXB • ٕज़ϒϩά IUUQTCMPHKJDPNBOJOGP • ݩ1)1FSɻ࠷ۙ(PݴޠͰπʔϧ։ൃ • Yࡀɻݟͨྸ Data Strategy & Operation Center Development Group ΠϯϑϥΤϯδχΞ
Slide 3
Slide 3 text
Twitterハッシュタグ #SBB ηογϣϯͷײ(Α͔ͬͨʂͱ͔) ϚαΧϦ(༏ͯ͘͠͠Ͷ) ฉ͖͔ͨͬͨ͜ͱ(࠙ձͰ) ͲΜͲΜπΠʔτ͍ͯͩ͘͠͞ʂʂ
Slide 4
Slide 4 text
Sansan Builders Box 本⽇のゴール AWSͱGCP྆ํͷಛΛͬͯ ༗ޮ׆༻͢ΔͨΊͷώϯτΛ ࣋ͪؼͬͯΒ͏
Slide 5
Slide 5 text
Sansan Builders Box - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - 各クラウドの特徴 - まとめ Agenda
Slide 6
Slide 6 text
Sansan Builders Box 名刺データ化システム(GEES) ໊ը૾ ໊σʔλ ໊σʔλ ࣗಈೖྗ ΦϖϨʔλ ໊ը૾
Slide 7
Slide 7 text
Sansan Builders Box Architecture VPN Gateway NAT ZONE Compute Engine Autoscaling Cloud Load Balancing ZONE Compute Engine Autoscaling VPC NAT gateway VPN Gateway VPN Connection Web Application Batch Processing DB Data Processing AWS Cloud Stackdriver Logging Vision API
Slide 8
Slide 8 text
Sansan Builders Box • マネージドサービスを積極的に活⽤ • 3層アーキテクチャ + バッチ • オペレータ⽤⼊⼒サイト • ⾃動化API (OCR含む) • EC2がメイン、ECS、AWS Batchも増えている • データベースは基本的にAurora。⽤途に応じて Redshift、 DynamoDB、 CloudSearch • データ化フローの制御にSimple Workflow (SWF)を利⽤ AWS VPC VPN Gateway Web Application Batch Processing DB Data Processing AWS Cloud NAT gateway
Slide 9
Slide 9 text
Sansan Builders Box GCP • 名刺画像データのOCR処理プロセスの中で Cloud Vision APIを採⽤ • データ⾃動化を担うAPIサービスの⼀部をGCPに移⾏ • HTTP Load Balancer + GCE • ⾼速にレスポンスを返すよくあるAPIではない • 画像データを解析した結果を返すのでマシン リソースを⼤量に消費する • c4.8xlarge(36 vCPU) で 0.8 RPS/台程度 • レスポンスタイム ⼗数秒 VPN Gateway NAT ZONE Compute Engine Autoscaling Cloud Load Balancing ZONE Compute Engine Autoscaling Stackdriver Logging Vision API
Slide 10
Slide 10 text
Sansan Builders Box • Stackdriver Loggingによるログ収集、GCSによる⻑期保管 • Cloud Audit Logging: GCPにおける操作履歴 • VPC Flow Logs: ネットワークトラフィックをキャプチャ • Linuxのauditd, Windowsのイベントログ • Loggingエージェントでログをパース • アプリケーションログはAWS側にあるFluentdサーバに送信 • AWS NLB + FluentdにVPN経由で送信 Logging on GCP
Slide 11
Slide 11 text
Sansan Builders Box • クラウド間の通信はインターネット経由(HTTPS)とVPNを併⽤ • AWS VPNの上限 (最⼤ 1.25 Gbps)を考慮 • VPNはDBなどのプライベート接続なやログ転送に利⽤ • APIへのPOST(画像データ)はインターネット経由 Data Transfer
Slide 12
Slide 12 text
Sansan Builders Box • VPCからインターネットへのアウトバウンドに対して コストが発⽣する • アウトバウンドのデータ量を減らす • 画像をJPEGからWebPに変更(50%圧縮) • JSONからMessagePackに変更(75%圧縮) • AWSのデータ転送料⾦が約30%下がったのが追い⾵に クラウド間のデータ転送に注意する
Slide 13
Slide 13 text
Sansan Builders Box Agenda - 名刺データ化システムとアーキテクチャ - AWS͔ΒGCPͷҠߦ - 各クラウドの特徴 - まとめ
Slide 14
Slide 14 text
Sansan Builders Box • CloudEndureを使ってEC2からGCEに移⾏ • エージェントによるレプリケーションでリアルタイム同期 • EC2とGCEでいくつか設定が異なるので注意が必要 • できることなら⼀からプロビジョニングしたほうが早い VMマイグレーション
Slide 15
Slide 15 text
Sansan Builders Box • 通常のGCEとプリエンプティブVMのインスタンスグループを作成 • プリエンプティブVMを有効活⽤してコストダウン • CPU使⽤率ではなくスループット(RPS)によるスケーリング • アプリケーションの性能に即した形 • AWSにあってGCPにない機能はツール⾃作でカバー • スケジュールベースのスケーリング • Cloud Schedulerがリリースされたので移⾏する予定 Auto Scaling
Slide 16
Slide 16 text
Sansan Builders Box Agenda - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - ֤Ϋϥυͷಛ - まとめ
Slide 17
Slide 17 text
Sansan Builders Box • AWS • ユースケースに合わせたインスタンスタイプ • コンピューティング最適(C5), メモリ最適(R5, X1), GPUインスタンス(P3, G3) etc • CPU、メモリが決められている • GCP • カスタムマシンタイプによる柔軟性 • CPU性能が画⼀的。CPUバウンドな処理だとスループットが厳しくなる ことも • 起動時間が早い ※ Linuxの場合 Compute Engine
Slide 18
Slide 18 text
Sansan Builders Box • AWS • マルチリージョンの敷居が若⼲⾼い • リージョン限定したい場合は安⼼感がある • VPNの帯域に注意する • GCP • マルチリージョンの敷居が低い • リージョン限定したい場合は注意が必要 • VPNの拡張性が⾼い Networking
Slide 19
Slide 19 text
Sansan Builders Box • AWS • シンプルで使いやすい • バックエンドインスタンスの負荷を⾒ていい具合に分散する • GCP • 必要な設定要素がおおく、やや難しい • プレウォーミング不要 • 複数のリージョン間へのリクエストを⾃動的に割り振る • バックエンドにGCSも可能(画像やCSS, JSなど静的コンテンツに便利) • ゾーン内のインスタンスへの分散はラウンドロビンで均⼀ Load Balancer
Slide 20
Slide 20 text
Sansan Builders Box • AWS • εϙοτΠϯελϯε: EC2のキャパシティに応じて最⼤90%割引 • εϙοτϑϦʔτ: キャパシティ指定していい具合にスポットを活⽤ • ϦβʔϒυΠϯελϯε(RI): 前払いなし、⼀部前払い、全額前払い • コンバーチブルRI だとインスタンスタイプの変更も可能 • ⼀括請求に紐付けることで他のAWSアカウントも割引が効く • GCP • ϓϦΤϯϓςΟϒVM: 80%近くの割引。値段固定 • ܧଓར༻ׂҾ: 起動時間に応じて⾃動的に割引。⻑時間稼働へのコスト削減 • ֬ར༻ׂҾ: CPUとメモリをコミットすることで割引。前払いなし Pricing
Slide 21
Slide 21 text
Sansan Builders Box • AWS • σʔλอଘ࣌ͷ҉߸Խ: 新規作成時に暗号化設定する必要がある • ⾮暗号化から暗号化への変更が難しいものもある • Ϣʔβݖݶ(IAM):グループ機能のサポート、細かい制御が可能 • GCP • σʔλอଘ࣌ͷ҉߸Խ: 全サービスがデフォルトで暗号化される • Ϣʔβݖݶ(IAM): グルーピングや細かい作業が難しい • 最近β版がリリースされたがまだまだ機能として不⼗分 Security
Slide 22
Slide 22 text
Sansan Builders Box - 名刺データ化システムとアーキテクチャ - AWSからGCPへの移⾏ - 各クラウドの特徴 - ·ͱΊ Agenda
Slide 23
Slide 23 text
Sansan Builders Box 本⽇のゴール(再掲) AWSͱGCP྆ํͷಛΛͬͯ ༗ޮ׆༻͢ΔͨΊͷώϯτΛ ࣋ͪؼͬͯΒ͏
Slide 24
Slide 24 text
No content