AWS Summit 2019にて登壇 DMM.comの組織改革にAWSをいかに活用しているか。
S U M M I TTo k yo
View Slide
© 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.S U M M I TDMM.comの改⾰とAWSMatsumoto YukiCTODMM.com LLC / DMM GAMES LLCI 2 - 0 7
© DMM.com• 松本 勇気 (@y_matsuwitter)• DMM.com CTO• 経歴• 東京⼤学在学中に3社のスタートアップを⽴ち上げ・参加• 2013年 Gunosy⼊社• Gunosyにて執⾏役員、CTO、新規事業担当を経てDMM.comへ• 趣味• ガジェット収集、筋トレ、料理、⼦育て• 未来を感じる技術が好きです。3⾃⼰紹介
© DMM.com本⽇の話• 組織を牽引する・改⾰する⽴場の⽅向けに、組織を如何に変⾰するか、その中でAmazon Web Serviceがいかなる改善をもたらすか、DMM.comの事例からお話します。4
© DMM.com⽬次• 2018.10時点での課題• DMM Tech Vision• Agility / Scientific / MotivativeとAWS5
© DMM.comCTO就任時におけるDMMの課題⽇本の多くの組織が抱える技術活⽤の壁6
© DMM.com⼊社時点でのDMMの課題7ビジネスモデルや営業⼒に⽐べ、事業年数の経過もあってか技術活⽤が今⼀歩不⾜していた。20年続くシステムl またシステムの多くが⻑期間運⽤されておりコード上の複雑度が上昇事業と開発が⻑らく別会社運⽤l エンジニアリングによる事業改善の流れが不⾜していた。l 営業とビジネスモデルの強さで成⻑。事業部間のコミュニケーションl 各事業が各々独⽴して動いており、知⾒の共有、標準化が不⾜。技術と事業、および事業間の分離 定性的事業判断データによる定量性的分析の活⽤不⾜l 現代の事業はデータがその中⼼にあるべき。l 現状の社内では定性的な意思決定が多い。機械学習ベースの事業改善の不⾜l 情報配信 = 検索と機械学習の世界l 現状ではマニュアルに運⽤されている箇所がほとんど。
© DMM.comテックカンパニー化をミッションにCTOへ8
© DMM.com 9テックカンパニーとは事業の全てがソフトウェア・エンジニアリングで改善される状態を理想。技術を交えた課題解決l 全ての事業や組織に関わる仕組みを、特にソフトウェア・エンジニアリングで繋げる。コード・計測l DMMに関わる全てをコードで表現していく。l システム化の先に全てを計測し、データとして保存。技術指向・ソフトウェア化計測と事業モデリングl プロダクトだけでなく、組織に関わる全てを計測し、指標化し、連動する⼀つのモデルとして表現する。個別最適化l ⼈では不可能なレベルの細やか、かつ⾃動的な最適化l 結果としての省⼒化と改善の双⽅を達成する。データドリブンイテレーティブな改善l ⽇々細かい検証ループを回しながら数多くの施策を試す。l ABテストにより着実に改善を積み上げる。失敗を許容するl 不具合等発⽣しても復旧可能であるレジリエントなシステム。Agility
© DMM.comDMM Tech Vision技術とデータ、資本と意思決定速度を活かした事業改善へ10
© DMM.comDMM Tech Vision11
© DMM.com 12
© DMM.com 13
© DMM.com 14
© DMM.comAgilityとAWS失敗を許容するアーキテクチャへ移⾏する15
© DMM.com 16⻑い時間を経たシステムの課題点20周年を経たDMMの抱えるシステムには当然ながら相応の課題が⼭積。システム起因の課題コードの循環複雑度やネットワークの構造が⾮常に複雑、依存を紐解く必要がある。システムの複雑度複数事業やドメインが⼀つのシステムに乗るため改修による不具合が横断して影響。巨⼤なモノリス古いコードに関する知⾒が失われているケースも散⾒されている。属⼈化した運⽤システムの改善に伴うリスクや⼼的・⼈的コストが⾼く、開発⾯での挑戦が減っている。
© DMM.comDMMにおけるAgilityとは︖17⼩さく多くの挑戦が⾏われる環境失敗を許容するシステムとチームプラクティスの標準化+
© DMM.com 18改善における主要なポイント誰もが素早くサービス開発で成果を挙げられる⼟壌をシステムで達成する。⽬指す開発像良い施策が素早くユーザーに届く開発チームと開発フロー設計(CI/CDなど)⾼いアジリティ特定のレールに乗っかることで、事前に問題が起きないシステム構成に導く。Security / Scalability事前担保ミス⼀つあたりのセキュリティ等影響範囲を⼩さく押さえ込み、挑戦がしやすい環境へ。⼩さなシステム新技術導⼊や開発フロー、コミュニケーションツールなどで、常に⽣産性の向上を⽬指していく。モダン化
© DMM.com 19具体的な取り組み全社的な号令として改善策を多く⽴ち上げ、実⾏。信頼性向上l AWS活⽤における最適化や監視などの改善l 新規事業⽴ち上げにおける素早いプラクティス導⼊標準化⽀援l 複数事業への改善プラクティスを集約l コードによる定義とその布教活動実施横断SRE部⽴ち上げ運⽤の⼈的コスト削減l CI/CD、IaC、監視導⼊、コンテナ化など徹底l 運⽤における⾃動化を推進柔軟なスケールと改善速度担保l 素早いロールバックの整備l スケールの⾃動化による負荷対応のコスト削減オンプレ / AWS最適化安定運⽤に関わる共通部分の横断的な標準化l サービス監視— Datadogの導⼊と基準提⽰l Infrastructure as Codeにおけるベストプラクティスの⽂書化— Gitbookにて運⽤部分的標準化
© DMM.com 20なぜAWSを活⽤するに⾄ったかAgilityに貢献することを重視し、オンプレ/AWSの棲み分けを⽬指す。豊富なマネージドサービスの存在(LambdaやFargateなど)移⾏の⼿厚いサポートや社内教育への強⼒なバックアップ容易で安定したスケーラビリティIaCによるベストプラクティスの横展開加速AWSへのサービス移⾏のメリット
© DMM.com最初の移⾏プロジェクトとして電⼦書籍事業を採択。• 事業規模• DMM全体では2900万ユーザー、25億PV• 事業単体で売上規模年間100億円超え• スコープ• 主要なユーザー向けWebApp• その裏にある主要データベース• 採択理由• ⽐較的他事業との依存が⼩さい。• 事業規模としては⼗分⼤きい。21事例︓電⼦書籍事業のAWS移⾏
© DMM.com電⼦書籍 共通基盤移⾏前のアーキテクチャ22MySQL⼤量のAPI群MobileApp管理者On-premiseAppAdminApp⼤量のDB群CouchbaseBatchWeb
© DMM.com移⾏後のアーキテクチャ23AWS CloudVPCPublic subnetPrivate subnetAuto Scaling groupECSApp Admin⾃社DCCouchbaseAuroraMemcachedJenkins + batchDB群
© DMM.com 24Well-Architectedレビューの活⽤AWSのソリューションアーキテクトと連携し移⾏先アーキテクチャのブラッシュアップを実施。カテゴリSecurityPerformanceCostOperationReliability⽬的 レビューを受けてのアクションnリスク評価とその軽減n耐障害性や復旧の迅速化n需要に応じたリソース効率追求n運⽤上のコスト削減nビジネス要件にあった運⽤効率n各種項⽬の解説を受けてのアーキテクチャ⾒直しn障害対応フローの刷新n連絡⼿段整理や障害定義の明確化n各種障害シナリオの洗い出しと障害試験の実施n残る単⼀障害点の確認など
© DMM.com既存事業のAWS移⾏に伴う効果25ビジネス側⾯でも開発側⾯でも移⾏により改善が⼤きく⾒られた。監視とスケーリングl 安定性に関わる項⽬を移⾏で洗い出し、徹底して監視l Auto Scaleによりリソースも柔軟に確保リリース頻度の改善l コンテナ化やECSを⽤い、CI/CDフローも構築していくことでリリースとロールバックの効率を⼤きく改善。— デプロイにおける安全性の確保がリリースの障壁を減らした。改善速度の向上 事業部内の⾃由度増加様々なマネージドサービスの活⽤l リードタイム無しに様々なマネージドサービスを利⽤可能に。— オンプレ上ではリソースの確保や導⼊、その後のマネージなどで⾒積もりが必要— 勿論コストはトレードオフ⾃⽴性向上l 結果としてチーム内でシステム改修や変更のレビューが容易になり挑戦が容易に。— AWS導⼊にあたってはIaCやCI/CDの徹底も重要
© DMM.comScientificとAWSデータ活⽤におけるオンプレDWHとの連携26
© DMM.com 27データ活⽤における課題点組織やサービスが⼤きくなるほど、データ量やその制御に課題。システム起因の課題データ活⽤が未成熟なため、初期コストを抑え⼩さくスタートしたい。基盤コスト⽉間25億PVから⽣まれるログ量は⾮常に膨⼤。データ量個⼈情報やその他機微情報の観点からアクセスを制限したい。アクセス制御今後の活⽤に向けての第⼀弾として柔軟なリソースの⼿配による成果を上げたい。
© DMM.comDMMにおけるScientificとは︖n 科学的⼿法– 測定可能性– 定量性– 再現性– 統計的有意性– 論理的整合性n 施策の影響を数値として計測、対照実験していくことで着実な成⻑を作る。n 誰でも運⽤可能な再現性のあるノウハウを蓄積していく。ユーザーと売上、利益をつなげる科学的経営、KPI経営を志向。計測 課題仮説検証ノウハウ・知⾒ノウハウ・知⾒ノウハウ・知⾒数値を共通⾔語として、ビジネス・開発の垣根なく改善できる組織を⽬指す。
© DMM.com事例︓既存データ分析環境の拡充オンプレに配置されたHadoopクラスタを中⼼とした構成。オンプレ上にあり、データ活⽤の増加に伴いリソースの枯渇が予想された。On-PremiseHadoop ClusterClientRedashPrestoHDFSYARNSqoop/Spark etc Hive
© DMM.comデータ基盤のAthena / Glue活⽤distcpによりデータ同期し、Athenaの柔軟なスケーリング能⼒を活⽤。On-PremiseHadoop ClusterClientRedashPrestoHDFSYARNSqoop/Spark etc HiveAWS CloudAmazon AthenaAWS GlueS3distcp
© DMM.comMotivativeとAWS⼈が育つ組織にむけての連携31
© DMM.comDMMにおけるMotivativeとは︖32AWSとの連携で、より成⻑できるDMMへ。• モチベーション×能⼒の総和が組織⼒と考える。• モチベーションの源泉• 仕事の意義の理解• 個⼈としての成⻑• 事業上の達成• 個⼈の成⻑と組織の⽬標達成が統合される環境を⽬指す。マネジメント個⼈組織成⻑機会の提供、報酬など組織⽬標の達成
© DMM.com学びを促進するための個⼈開発環境の提供。• 社員個別にAWS アカウントを提供• ⽉額100ドルまで利⽤可能• アカウント管理はAWS Organizationsを活⽤• AWS CloudTrailにて動作は記録• 活⽤事例• 新AWSサービスの検証• 新たな⾔語やFWの学習33AWS実弾演習場
© DMM.com⾃⾝の専⾨性を効率よく発揮するための横断的カリキュラムの実施に伴いご協⼒いただいた。• 19年度からの新卒研修⽅針• インフラ、Backend、Frontend、Native Appなど横断的に実施• ボリュームは3.5ヶ⽉• AWSトレーニングを活⽤し、AWSの応⽤⼒を⾝につける。• 利⽤したカリキュラム• AWS Technical Essentials 2• Architecting on AWS34新卒教育カリキュラムでのオンサイト研修
© DMM.com主に新設のSREチームと連携して社内ハンズオンを提供。• ECSハンズオン会• AWSのソリューションアーキテクトの皆さんにご協⼒いただき、主にコンテナベースでのインフラ運⽤をレクチャ。• インフラ構築を実践する中でこれからSREとして標準的に採⽤しようとする技術に触れてもらう。35社内勉強会の開催
© DMM.com 36AWSとの連携で、成⻑できるDMMへ技術⼒・課題解決⼒の成⻑可能性が事業成果とモチベーション向上へ。失敗を許容できる環境の提供l 気になった技術をいつでも試し、失敗できることが学習につながる。AWSで安全な実験環境l セキュリティ的な安全性をAWS Organizations等により担保。AWS実弾演習場有償研修の活⽤l AWSを実践的に活⽤するのに⼗分な知識⽔準を初期に達成。課題解決は知識からl 関連する事例を多く知る・検索できることで迅速な課題解決が可能に。l ⼈と⼈が連携する際の共通⾔語に。新卒教育カリキュラム標準化に向けた知識⽔準向上l 社内にて標準的に使っていこうとする技術について、AWSと連携して学習の場を提供l ハンズオンの形を取ることで運⽤のイメージを掴む。社内ハンズオン
© DMM.comまとめ37
© DMM.comまとめ38⼤きな組織が抱える課題l 歴史が⽣み出すAgilityの低下、データ活⽤の不⾜ビジョンの提⽰l Agility・Scientific・Attractive・Motivativeをベースとして開発やデータ、組織全体を帰るための戦略を⽴案AWSを活⽤しての組織全体の改善l Agility: オンプレからAWS活⽤での柔軟なアーキテクチャへ移⾏、挑戦が容易に。l Scientific︓Athenaなどを活⽤し、データ分析・機械学習のリソースを柔軟に。l Motivative︓ AWSと連携しての教育施策からメンバーが成⻑できる環境を作る。AWSを活⽤しつつ、DMMの組織全体を改善している現状について共有。
© DMM.com最後に״չזד֮պזDMMפ3䎃ד⚅歲宏彊ה鎉ִذحؙؕٝػص٦פأة٦ز،حف״稆傍ֻׁח㣐ֹז✲ 噟⡲ِص٦ؙז⠓爡פ剑䖓ח ...39AgilityやScientificを⾼めていくべく、AWSを活⽤し進んでいきます。