Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
エンジニアでも論文が読みたい!
Search
Honahuku
October 17, 2024
Technology
0
490
エンジニアでも論文が読みたい!
PIXIV DEV MEETUP 2024 での発表資料です
https://conference.pixiv.co.jp/2024/dev-meetup
Honahuku
October 17, 2024
Tweet
Share
More Decks by Honahuku
See All by Honahuku
大規模コンピューティングを支える Kubernetes のネットワーク
honahuku
0
44
今から始める分散システム
honahuku
0
250
SecAd~Ad data drivin’ network security~
honahuku
0
140
Other Decks in Technology
See All in Technology
生成AIのガバナンスの全体像と現実解
fnifni
1
180
Jetpack Composeで始めるServer Cache State
ogaclejapan
2
170
あの日俺達が夢見たサーバレスアーキテクチャ/the-serverless-architecture-we-dreamed-of
tomoki10
0
420
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
Qiita埋め込み用スライド
naoki_0531
0
860
マルチプロダクト開発の現場でAWS Security Hubを1年以上運用して得た教訓
muziyoshiz
2
2.2k
Oracle Cloud Infrastructure:2024年12月度サービス・アップデート
oracle4engineer
PRO
0
170
社内イベント管理システムを1週間でAKSからACAに移行した話し
shingo_kawahara
0
180
podman_update_2024-12
orimanabu
1
260
C++26 エラー性動作
faithandbrave
2
700
私なりのAIのご紹介 [2024年版]
qt_luigi
1
120
Amazon SageMaker Unified Studio(Preview)、Lakehouse と Amazon S3 Tables
ishikawa_satoru
0
150
Featured
See All Featured
The Invisible Side of Design
smashingmag
298
50k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
0
96
Building Applications with DynamoDB
mza
91
6.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
Faster Mobile Websites
deanohume
305
30k
Statistics for Hackers
jakevdp
796
220k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
5
440
Git: the NoSQL Database
bkeepers
PRO
427
64k
YesSQL, Process and Tooling at Scale
rocio
169
14k
Building a Scalable Design System with Sketch
lauravandoore
460
33k
Practical Orchestrator
shlominoach
186
10k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Transcript
エンジニアでも論文が 読みたい! Honahuku
アドプラットフォーム事業部/ アド・プロダクト部/ 広告なんでもチーム エンジニア Honahuku
今回話さないこと • 論文の読み方 • 具体的な研究のいろは・進め方
今回話すこと • エンジニアリングと研究の似ているところ • エンジニアリングに活かせるアカデミックなアプローチ • 私の活用事例
研究,やってますか 私は最近全然できてません
研究ってなんだよ • 事業会社でエンジニアをしながら研究をしている人は多 くないと思う • しかしエンジニアリングに研究の考え方が生きることが ある
エンジニアリングの手法 • 技術選定 ◦ 他社の事例や業界動向など複数の要素から意思決定 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決
研究の手法 • 技術選定 ◦ 他社の事例や業界動向など複数の情報を収集 • 新環境の負荷試験 • ポストモーテム・プレモーテム •
課題解決 先行研究の調査 実験 結果考察 研究目的
研究のモチベーション • 研究とエンジニアリングは似ている点もあるが、異なる 点も多い • 仮に同じ目的があったとしても『研究』と『エンジニア リング』はアプローチが異なるはず
アカデミックなアプローチ • 論文というフォーマット ◦ 序章(背景)、手法、実験、考察、結論 ◦ 論文を読み、ディスカッションを重ね、検討し、より 良い案を提案する
アカデミックなアプローチ • 信頼度と情報ソース ◦ 単なる妄想は学問とは言えない ◦ 知識の積み上げ(先行研究)、情報ソースは重要
なぜ Honahuku は 論文を読むのか
自分の領域へ普段と違う 切り口から切り込むと嬉しい
何が嬉しいかというと 論文という別角度のデータソースから より理解を深めることが出来る
何が嬉しいかというと • why に切り込んだ背景知識を得られる • 関連する課題や手法へのインデックスを貼れる • 局所最適な手法に囚われすぎない
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく可観測性と回復力を 高める取り組みを考えていた
論文紹介 • MS の SRE に関する論文 ◦ インシデント検知の問題点 ▪ モニターの不足によるインシデントの対応遅れ
▪ 不要なモニターによるオオカミ少年なアラート ◦ サービスに対する監視を分析し、改善手法の実証実験を 行った[ganatra2023] • [ganatra2023]: Detection is better than cure: A cloud incidents perspective, https://doi.org/10.1145/3611643.3613898
監視とインシデント対応 • モニターの不足はインシデント対応遅れや連鎖的な障害発 生に繋がる • 検出までの時間(Time to Detect)は シグナルやアラートが欠落していると最大 •
障害対応時間(Time to Mitigate)はモニター についてのドキュメントに欠落・誤りがある と伸びる
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い
カスケード障害 • DBが停止するインシデントが発生したとする ◦ エンキューに時間がかかりジョブが詰まる ▪ DB停止に気づけてもキューのスタック検知のアラート が無ければ障害時間の増加がありえる ▪ システムの全容を把握している人や経験豊富な人は気
付ける可能性が高い そうでない人は?
モニターの見直し • モニターは過去の障害発生を元に追加されてきた ◦ 場当たり的なモニター追加は欠落や重複を招くのでは? • 賢いモニタリングフレームワークはモニター追加や重複削除 の提案をしてくれそう ▪ インシデントを学習(ML)させて提案に使う
Honahuku のケース • 属人性が高くなんとなくで動いているインフラへの 問題意識 • プロダクトの可用性だけでなく回復力と可観測性を 高める取り組みを考えていた
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む
チームへの適用 • 同じように不要なモニターが無いか、見落としているメト リクスは無いかを洗い出し • 残った必要なモニターに対してアラートロジックとドキュ メントに誤りが無いかを確認することをPJに盛り込む 論文を元にした対応方針の検討
アカデミックなアプローチで より快適な エンジニアリングライフを!