Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メールサービスの信頼性を支えるSREの取り組み
Search
haruki
July 05, 2024
Technology
2
2k
メールサービスの信頼性を支えるSREの取り組み
haruki
July 05, 2024
Tweet
Share
More Decks by haruki
See All by haruki
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
harukin721
0
1.4k
Other Decks in Technology
See All in Technology
「隙間家具OSS」に至る道/Fujiwara Tech Conference 2025
fujiwara3
7
6.4k
.NET 最新アップデート ~ AI とクラウド時代のアプリモダナイゼーション
chack411
0
200
いま現場PMのあなたが、 経営と向き合うPMになるために 必要なこと、腹をくくること
hiro93n
9
7.7k
生成AI × 旅行 LLMを活用した旅行プラン生成・チャットボット
kominet_ava
0
160
エンジニアリングマネージャー視点での、自律的なスケーリングを実現するFASTという選択肢 / RSGT2025
yoshikiiida
4
3.7k
データ基盤におけるIaCの重要性とその運用
mtpooh
4
510
月間60万ユーザーを抱える 個人開発サービス「Walica」の 技術スタック変遷
miyachin
1
140
My small contributions - Fujiwara Tech Conference 2025
ijin
0
1.4k
Docker Desktop で Docker を始めよう
zembutsu
PRO
0
170
Evolving Architecture
rainerhahnekamp
3
250
Oracle Exadata Database Service(Dedicated Infrastructure):サービス概要のご紹介
oracle4engineer
PRO
0
12k
Amazon Route 53, 待ちに待った TLSAレコードのサポート開始
kenichinakamura
0
170
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
The Pragmatic Product Professional
lauravandoore
32
6.4k
Code Review Best Practice
trishagee
65
17k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.1k
We Have a Design System, Now What?
morganepeng
51
7.3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
Thoughts on Productivity
jonyablonski
68
4.4k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.5k
How to Think Like a Performance Engineer
csswizardry
22
1.3k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.3k
Transcript
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road
to SRE NEXT@京都
2 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki •
カラーミーショップのSRE • メール勉強中!!! • 初の社外登壇 • 奈良県出身 X : @harukin721
4 2. 担当サービス紹介
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ◦ 2005年にサービス開始 ◦ 現在のショップ数:約4万店舗 ◦ 現在の流通総額:約2,000億円
メールサービスの規模 ◦ メールアカウント数:約85,000ユーザー ◦ メールサーバー:20台 ◦ メールリレーサーバー:8台
6 3. メールサービスの信頼性とは
メールサービスの信頼性 7 メールサービスの信頼性とは • メールのなりすましや改ざんがなく、メールが遅延なく到達する • メールアカウント数やメールの送受信量の増加に柔軟に対応できる • CS部門と連携して、お問い合わせにすばやく対応できる
8 4. 発生した問題
9 ショップオーナーさん: 「メールが届いていないようです。」
なぜ、メールが届いていない? 10 発生した問題 • メールが届かない原因は多岐にわたる ◦ 特定の宛先のみメールが届いていないのか? ◦ 特定のメールサーバーからのみメールが届いていないのか? ◦
IPレピュテーションが低下して、DNSBLに登録されているのか?
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
12 4. 対応と対策
13 自分たちでコントロール できることで対応を行う
どう対応したのか? 14 対応と対策 • Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する • 送信元メールサーバーのIPを変更することで、ブロックを回避する • サービスプロバイダにブロックの解除申請を出す
Postfixのtransportファイル 15 対応と対策 • メールの送信経路を特定のサーバー経由に設定できる • ドメインやアドレスごとに送信経路を個別に設定できる
16 お問い合わせの前に気づくためには
お問い合わせの前に気づくためには 17 対応と対策 • 監視スクリプトを開発し、ブロックを自動的に検知 ◦ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ◦ オンコールドキュメントを作成し、アクションを起こして対応 SRE本
アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
18 メール送信量の増加を検知
メール送信量の増加を検知 19 対応と対策 • メール送信量の急激な増加はブロックを引き起こす可能性がある ◦ Gmailのガイドラインにも明記されている ◦ メール送信量の急激な増加を検知することは重要 ◦
メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
20 5. まとめ
まとめ 21 まとめ • メールは、意図せずブロックされてしまうことがある • SREノウハウをメールサービスにも取り入れて改善 ◦ お問い合わせ前にブロックを検知 ◦
オンコールドキュメントを作成し、迅速に対応 ◦ メール送信量の急激な増加を検知
ご静聴ありがとうございました! 22