Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メールサービスの信頼性を支えるSREの取り組み
Search
Haruki Uejima
July 05, 2024
Technology
2.5k
2
Share
メールサービスの信頼性を支えるSREの取り組み
Haruki Uejima
July 05, 2024
More Decks by Haruki Uejima
See All by Haruki Uejima
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
harukin721
0
1.8k
Other Decks in Technology
See All in Technology
Anthropic「Long-running a gents」をGeminiで再現してみた
tkikuchi
0
740
AI バイブコーティングでキーボード不要?!
samakada
0
660
FessのAI検索モード:検索システムとLLMへの取り組み
marevol
0
150
独断と偏見で試してみる、 シングル or マルチエージェント どっちがいいの?
shichijoyuhi
1
220
Arcana: Production-Ready RAG in Elixir @ ElixirConf EU 2026
georgeguimaraes
0
120
M5Stack CoreS3とZephyr(RTOS)で Edge AIっぽいことしてみた
iotengineer22
0
400
AI時代 に増える データ活用先
takahal
0
350
Route 53 Global Resolver で高額課金発生!
otanikohei2023
0
130
運用システムにおけるデータ活用とPlatform
sansantech
PRO
0
150
GitHub Copilot CLI と VS Code Agent Mode の使い分け
tomokusaba
0
110
音声言語モデル手法に関する発表の紹介
kzinmr
0
150
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
420
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
810
How to train your dragon (web standard)
notwaldorf
97
6.6k
エンジニアに許された特別な時間の終わり
watany
106
240k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
170
Docker and Python
trallard
47
3.8k
GitHub's CSS Performance
jonrohan
1032
470k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1k
Into the Great Unknown - MozCon
thekraken
41
2.4k
Being A Developer After 40
akosma
91
590k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
The Curious Case for Waylosing
cassininazir
0
320
Transcript
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road
to SRE NEXT@京都
2 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki •
カラーミーショップのSRE • メール勉強中!!! • 初の社外登壇 • 奈良県出身 X : @harukin721
4 2. 担当サービス紹介
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ◦ 2005年にサービス開始 ◦ 現在のショップ数:約4万店舗 ◦ 現在の流通総額:約2,000億円
メールサービスの規模 ◦ メールアカウント数:約85,000ユーザー ◦ メールサーバー:20台 ◦ メールリレーサーバー:8台
6 3. メールサービスの信頼性とは
メールサービスの信頼性 7 メールサービスの信頼性とは • メールのなりすましや改ざんがなく、メールが遅延なく到達する • メールアカウント数やメールの送受信量の増加に柔軟に対応できる • CS部門と連携して、お問い合わせにすばやく対応できる
8 4. 発生した問題
9 ショップオーナーさん: 「メールが届いていないようです。」
なぜ、メールが届いていない? 10 発生した問題 • メールが届かない原因は多岐にわたる ◦ 特定の宛先のみメールが届いていないのか? ◦ 特定のメールサーバーからのみメールが届いていないのか? ◦
IPレピュテーションが低下して、DNSBLに登録されているのか?
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
12 4. 対応と対策
13 自分たちでコントロール できることで対応を行う
どう対応したのか? 14 対応と対策 • Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する • 送信元メールサーバーのIPを変更することで、ブロックを回避する • サービスプロバイダにブロックの解除申請を出す
Postfixのtransportファイル 15 対応と対策 • メールの送信経路を特定のサーバー経由に設定できる • ドメインやアドレスごとに送信経路を個別に設定できる
16 お問い合わせの前に気づくためには
お問い合わせの前に気づくためには 17 対応と対策 • 監視スクリプトを開発し、ブロックを自動的に検知 ◦ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ◦ オンコールドキュメントを作成し、アクションを起こして対応 SRE本
アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
18 メール送信量の増加を検知
メール送信量の増加を検知 19 対応と対策 • メール送信量の急激な増加はブロックを引き起こす可能性がある ◦ Gmailのガイドラインにも明記されている ◦ メール送信量の急激な増加を検知することは重要 ◦
メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
20 5. まとめ
まとめ 21 まとめ • メールは、意図せずブロックされてしまうことがある • SREノウハウをメールサービスにも取り入れて改善 ◦ お問い合わせ前にブロックを検知 ◦
オンコールドキュメントを作成し、迅速に対応 ◦ メール送信量の急激な増加を検知
ご静聴ありがとうございました! 22