Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メールサービスの信頼性を支えるSREの取り組み
Search
haruki
July 05, 2024
Technology
2
2.3k
メールサービスの信頼性を支えるSREの取り組み
haruki
July 05, 2024
Tweet
Share
More Decks by haruki
See All by haruki
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
harukin721
0
1.6k
Other Decks in Technology
See All in Technology
Webブラウザ向け動画配信プレイヤーの 大規模リプレイスから得た知見と学び
yud0uhu
0
210
ガチな登山用デバイスからこんにちは
halka
1
220
AWS環境のリソース調査を Claude Code で効率化 / aws investigate with cc devio2025
masahirokawahara
2
1.4k
Codeful Serverless / 一人運用でもやり抜く力
_kensh
5
300
落ちる 落ちるよ サーバーは落ちる
suehiromasatoshi
0
140
5年目から始める Vue3 サイト改善 #frontendo
tacck
PRO
3
200
dbt開発 with Claude Codeのためのガードレール設計
10xinc
1
410
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
370
Flutterでキャッチしないエラーはどこに行く
taiju59
0
220
Kiroと学ぶコンテキストエンジニアリング
oikon48
6
9.2k
LLM翻訳ツールの開発と海外のお客様対応等への社内導入事例
gree_tech
PRO
0
580
AI エージェントとはそもそも何か? - 技術背景から Amazon Bedrock AgentCore での実装まで- / AI Agent Unicorn Day 2025
hariby
4
1.2k
Featured
See All Featured
Six Lessons from altMBA
skipperchong
28
4k
Building an army of robots
kneath
306
46k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.5k
Code Review Best Practice
trishagee
70
19k
Docker and Python
trallard
45
3.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
4 Signs Your Business is Dying
shpigford
184
22k
Agile that works and the tools we love
rasmusluckow
330
21k
Typedesign – Prime Four
hannesfritz
42
2.8k
Transcript
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road
to SRE NEXT@京都
2 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki •
カラーミーショップのSRE • メール勉強中!!! • 初の社外登壇 • 奈良県出身 X : @harukin721
4 2. 担当サービス紹介
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ◦ 2005年にサービス開始 ◦ 現在のショップ数:約4万店舗 ◦ 現在の流通総額:約2,000億円
メールサービスの規模 ◦ メールアカウント数:約85,000ユーザー ◦ メールサーバー:20台 ◦ メールリレーサーバー:8台
6 3. メールサービスの信頼性とは
メールサービスの信頼性 7 メールサービスの信頼性とは • メールのなりすましや改ざんがなく、メールが遅延なく到達する • メールアカウント数やメールの送受信量の増加に柔軟に対応できる • CS部門と連携して、お問い合わせにすばやく対応できる
8 4. 発生した問題
9 ショップオーナーさん: 「メールが届いていないようです。」
なぜ、メールが届いていない? 10 発生した問題 • メールが届かない原因は多岐にわたる ◦ 特定の宛先のみメールが届いていないのか? ◦ 特定のメールサーバーからのみメールが届いていないのか? ◦
IPレピュテーションが低下して、DNSBLに登録されているのか?
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
12 4. 対応と対策
13 自分たちでコントロール できることで対応を行う
どう対応したのか? 14 対応と対策 • Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する • 送信元メールサーバーのIPを変更することで、ブロックを回避する • サービスプロバイダにブロックの解除申請を出す
Postfixのtransportファイル 15 対応と対策 • メールの送信経路を特定のサーバー経由に設定できる • ドメインやアドレスごとに送信経路を個別に設定できる
16 お問い合わせの前に気づくためには
お問い合わせの前に気づくためには 17 対応と対策 • 監視スクリプトを開発し、ブロックを自動的に検知 ◦ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ◦ オンコールドキュメントを作成し、アクションを起こして対応 SRE本
アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
18 メール送信量の増加を検知
メール送信量の増加を検知 19 対応と対策 • メール送信量の急激な増加はブロックを引き起こす可能性がある ◦ Gmailのガイドラインにも明記されている ◦ メール送信量の急激な増加を検知することは重要 ◦
メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
20 5. まとめ
まとめ 21 まとめ • メールは、意図せずブロックされてしまうことがある • SREノウハウをメールサービスにも取り入れて改善 ◦ お問い合わせ前にブロックを検知 ◦
オンコールドキュメントを作成し、迅速に対応 ◦ メール送信量の急激な増加を検知
ご静聴ありがとうございました! 22