メールサービスの信頼性を支えるSREの取り組み
by
haruki
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road to SRE NEXT@京都
Slide 2
Slide 2 text
2 1. 自己紹介
Slide 3
Slide 3 text
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki ● カラーミーショップのSRE ● メール勉強中!!! ● 初の社外登壇 ● 奈良県出身 X : @harukin721
Slide 4
Slide 4 text
4 2. 担当サービス紹介
Slide 5
Slide 5 text
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ○ 2005年にサービス開始 ○ 現在のショップ数:約4万店舗 ○ 現在の流通総額:約2,000億円 メールサービスの規模 ○ メールアカウント数:約85,000ユーザー ○ メールサーバー:20台 ○ メールリレーサーバー:8台
Slide 6
Slide 6 text
6 3. メールサービスの信頼性とは
Slide 7
Slide 7 text
メールサービスの信頼性 7 メールサービスの信頼性とは ● メールのなりすましや改ざんがなく、メールが遅延なく到達する ● メールアカウント数やメールの送受信量の増加に柔軟に対応できる ● CS部門と連携して、お問い合わせにすばやく対応できる
Slide 8
Slide 8 text
8 4. 発生した問題
Slide 9
Slide 9 text
9 ショップオーナーさん: 「メールが届いていないようです。」
Slide 10
Slide 10 text
なぜ、メールが届いていない? 10 発生した問題 ● メールが届かない原因は多岐にわたる ○ 特定の宛先のみメールが届いていないのか? ○ 特定のメールサーバーからのみメールが届いていないのか? ○ IPレピュテーションが低下して、DNSBLに登録されているのか?
Slide 11
Slide 11 text
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
Slide 12
Slide 12 text
12 4. 対応と対策
Slide 13
Slide 13 text
13 自分たちでコントロール できることで対応を行う
Slide 14
Slide 14 text
どう対応したのか? 14 対応と対策 ● Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する ● 送信元メールサーバーのIPを変更することで、ブロックを回避する ● サービスプロバイダにブロックの解除申請を出す
Slide 15
Slide 15 text
Postfixのtransportファイル 15 対応と対策 ● メールの送信経路を特定のサーバー経由に設定できる ● ドメインやアドレスごとに送信経路を個別に設定できる
Slide 16
Slide 16 text
16 お問い合わせの前に気づくためには
Slide 17
Slide 17 text
お問い合わせの前に気づくためには 17 対応と対策 ● 監視スクリプトを開発し、ブロックを自動的に検知 ○ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ○ オンコールドキュメントを作成し、アクションを起こして対応 SRE本 アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
Slide 18
Slide 18 text
18 メール送信量の増加を検知
Slide 19
Slide 19 text
メール送信量の増加を検知 19 対応と対策 ● メール送信量の急激な増加はブロックを引き起こす可能性がある ○ Gmailのガイドラインにも明記されている ○ メール送信量の急激な増加を検知することは重要 ○ メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
Slide 20
Slide 20 text
20 5. まとめ
Slide 21
Slide 21 text
まとめ 21 まとめ ● メールは、意図せずブロックされてしまうことがある ● SREノウハウをメールサービスにも取り入れて改善 ○ お問い合わせ前にブロックを検知 ○ オンコールドキュメントを作成し、迅速に対応 ○ メール送信量の急激な増加を検知
Slide 22
Slide 22 text
ご静聴ありがとうございました! 22