Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
エンジニアでも論文が読みたい!
Search
Honahuku
October 17, 2024
Technology
0
870
エンジニアでも論文が読みたい!
PIXIV DEV MEETUP 2024 での発表資料です
https://conference.pixiv.co.jp/2024/dev-meetup
Honahuku
October 17, 2024
Tweet
Share
More Decks by Honahuku
See All by Honahuku
KubeCon + CloudNativeCon Japan 2025 に行ってきた! & containerd の新機能紹介
honahuku
0
130
「改訂版ブルーム・タキソノミー」を利用したソフトウェアドキュメンテーションの改善手法の提案
honahuku
0
470
Kubernetes のクラスタ内ネットワーク概要
honahuku
1
47
大規模コンピューティングを支える Kubernetes のネットワーク
honahuku
0
170
今から始める分散システム
honahuku
0
310
SecAd~Ad data drivin’ network security~
honahuku
0
180
Other Decks in Technology
See All in Technology
DatabricksにOLTPデータベース『Lakebase』がやってきた!
inoutk
0
140
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
240
SEQUENCE object comparison - db tech showcase 2025 LT2
nori_shinoda
0
210
改めてAWS WAFを振り返る~業務で使うためのポイント~
masakiokuda
2
310
CDKコード品質UP!ナイスな自作コンストラクタを作るための便利インターフェース
harukasakihara
2
140
OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例 / SRE NEXT 2025
mackerelio
2
920
CDK Vibe Coding Fes
tomoki10
1
320
VGGT: Visual Geometry Grounded Transformer
peisuke
1
310
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
3
970
SREの次のキャリアの道しるべ 〜SREがマネジメントレイヤーに挑戦して、 気づいたこととTips〜
coconala_engineer
1
250
ABEMAの本番環境負荷試験への挑戦
mk2taiga
5
370
オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ / Monitoring Office Buildings: The Challenge of Physical-Digital SLI/SLO Design & Operation
bitkey
1
150
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Code Review Best Practice
trishagee
69
19k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Faster Mobile Websites
deanohume
307
31k
The Language of Interfaces
destraynor
158
25k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
The Cult of Friendly URLs
andyhume
79
6.5k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.4k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
The Invisible Side of Design
smashingmag
301
51k
Transcript
エンジニアでも論文が 読みたい! Honahuku
アドプラットフォーム事業部/ アド・プロダクト部/ 広告なんでもチーム エンジニア Honahuku
今回話さないこと • 論文の読み方 • 具体的な研究のいろは・進め方
今回話すこと • エンジニアリングと研究の似ているところ • エンジニアリングに活かせるアカデミックなアプローチ • 私の活用事例
研究,やってますか 私は最近全然できてません
研究ってなんだよ • 事業会社でエンジニアをしながら研究をしている人は多 くないと思う • しかしエンジニアリングに研究の考え方が生きることが ある
エンジニアリングの手法 • 技術選定 ◦ 他社の事例や業界動向など複数の要素から意思決定 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決
研究の手法 • 技術選定 ◦ 他社の事例や業界動向など複数の情報を収集 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決 先行研究の調査 実験 結果考察 研究目的
研究のモチベーション • 研究とエンジニアリングは似ている点もあるが、異なる 点も多い • 仮に同じ目的があったとしても『研究』と『エンジニア リング』はアプローチが異なるはず
アカデミックなアプローチ • 論文というフォーマット ◦ 序章(背景)、手法、実験、考察、結論 ◦ 論文を読み、ディスカッションを重ね、検討し、より 良い案を提案する
アカデミックなアプローチ • 信頼度と情報ソース ◦ 単なる妄想は学問とは言えない ◦ 知識の積み上げ(先行研究)、情報ソースは重要
なぜ Honahuku は 論文を読むのか
自分の領域へ普段と違う 切り口から切り込むと嬉しい
何が嬉しいかというと 論文という別角度のデータソースから より理解を深めることが出来る
何が嬉しいかというと • why に切り込んだ背景知識を得られる • 関連する課題や手法へのインデックスを貼れる • 局所最適な手法に囚われすぎない
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく可観測性と回復力を 高める取り組みを考えていた
論文紹介 • MS の SRE に関する論文 ◦ インシデント検知の問題点 ▪ モニターの不足によるインシデントの対応遅れ
▪ 不要なモニターによるオオカミ少年なアラート ◦ サービスに対する監視を分析し、改善手法の実証実験を 行った[ganatra2023] • [ganatra2023]: Detection is better than cure: A cloud incidents perspective, https://doi.org/10.1145/3611643.3613898
監視とインシデント対応 • モニターの不足はインシデント対応遅れや連鎖的な障害発 生に繋がる • 検出までの時間(Time to Detect)は シグナルやアラートが欠落していると最大 •
障害対応時間(Time to Mitigate)はモニター についてのドキュメントに欠落・誤りがある と伸びる
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い そうでない人は?
モニターの見直し • モニターは過去の障害発生を元に追加されてきた ◦ 場当たり的なモニター追加は欠落や重複を招くのでは? • 賢いモニタリングフレームワークはモニター追加や重複削除 の提案をしてくれそう ▪ インシデントを学習(ML)させて提案に使う
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく回復力と可観測性を 高める取り組みを考えていた
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む 論文を元にした対応方針の検討
アカデミックなアプローチで より快適な エンジニアリングライフを!