Upgrade to Pro — share decks privately, control downloads, hide ads and more …

サービスを構成する全サーバが トラックに載って 遠くのデータセンターへ旅立ったお話

rsym1290
December 06, 2023
120

サービスを構成する全サーバが トラックに載って 遠くのデータセンターへ旅立ったお話

rsym1290

December 06, 2023
Tweet

Transcript

  1. 三上烈史(みかみ つよし) SNS - https://twitter.com/rsym1290 担当している業務 - インフラ - SRE

    趣味 - ランニング‧マラソン GMOペパボ株式会社 技術部プラットフォームグループ
  2. 30days Album • 写真や動画をアルバム形式で共 有できるサービス • 総アップロード数: ◦ 約9.4億枚(2023/11/24時点) •

    ⼤量の写真‧動画保存するため にオブジェクトストレージを ⽤ いている https://30d.jp/

  3. 30days Albumは⼤規模なストレージが命 2023/9/26メンテ当時の台数 • ラック3台契約 • サーバー19台 • ストレージサーバー14台 •

    HDD約350本(6TB〜22TBまでたくさん) ◦ ストレージの総容量は4.5PB(ペタバイト)を超えています
  4. 30days Albumでのオブジェクトの冗⻑化 storage storage storage storage storage storage これはアウト storage

    storage storage storage storage storage これはアウト データロストの条件 storage storage storage storage storage storage これはセーフ
  5. MogileFSでは冗⻑化のポリシーを決められる $ sudo mogadm domain list domain class mindevcount replpolicy

    hashtype -------------------- -------------------- ------------- ------------ ------- … 30days default 2 HostsPerNetwork(group_a=1, group_b=1) NONE $ sudo mogadm settings list ... network_zones = group_a,group_b zone_group_a = 192.168.XX.0/24 zone_group_b = 192.168.YY.0/24 group_aとgroup_bに1つずつ配置される様にレプリケーション group_aとgroup_bはサブネットで区別する
  6. オブジェクトを2グループに再配置 グループA storage storage storage storage storage storage • オブジェクトは2つのサーバーへ冗⻑に格納される

    • 配置先はハードディスクの使⽤率に依存する • 実質ランダム MogileFSの 機能で再配置 storage storage storage • オブジェクトは2つのグループに冗⻑に格納される • 各グループのどのハードディスクに格納されるかは使 ⽤率に依存する グループB storage storage storage 各グループに必ず1つ オブジェクトがある 従来 再配置
  7. 9/26 21:00~9/28 9:00にかけて実施 1. サービスをメンテに切り替え 2. サーバー全停⽌ 3. 全サーバーのアンラッキング 4.

    トラックで搬送 🚚💨 5. 全サーバーのラッキング‧ケーブリング 6. 電源投⼊‧動作確認 7. メンテ解除 メンテの実施