Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ集計結果を提供するAPIとServerlessでの失敗談
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
dasoran
January 18, 2019
Technology
0
570
データ集計結果を提供するAPIとServerlessでの失敗談
dasoran
January 18, 2019
Tweet
Share
More Decks by dasoran
See All by dasoran
llama.cppのバックエンドggmlを読もう
dasoran
0
76
Rift Sで沢山苦労した話といくつかの処方箋
dasoran
0
340
機械学習を支えるx86-64の拡張命令セットを読む会
dasoran
0
55
Other Decks in Technology
See All in Technology
Copilot 宇宙へ 〜生成AIで「専門データの壁」を壊す方法〜
nakasho
0
130
Phase11_戦略的AI経営
overflowinc
0
250
Phase09_自動化_仕組み化
overflowinc
0
280
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
8
4.1k
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
370
開発チームとQAエンジニアの新しい協業モデル -年末調整開発チームで実践する【QAリード施策】-
kaomi_wombat
0
180
欠陥分析(ODC分析)における生成AIの活用プロセスと実践事例 / 20260320 Suguru Ishii & Naoki Yamakoshi & Mayu Yoshizawa
shift_evolve
PRO
0
230
スピンアウト講座05_実践活用事例
overflowinc
0
190
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
スピンアウト講座01_GitHub管理
overflowinc
0
220
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
tarappo
3
280
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini Embedding 2 の紹介
tsho
0
130
Featured
See All Featured
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
480
The Mindset for Success: Future Career Progression
greggifford
PRO
0
280
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
400
How to Ace a Technical Interview
jacobian
281
24k
A Tale of Four Properties
chriscoyier
163
24k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Balancing Empowerment & Direction
lara
5
950
Documentation Writing (for coders)
carmenintech
77
5.3k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
150
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.2k
Transcript
データ集計結果を提供するAPIと Serverlessでの失敗談 データとML周辺エンジニアリングを考える会 #1 2019/1/18 @dasoran2
自己紹介 - なんでもやるエンジニア - Python(クラウド系ツール、 Webアプリ、機械学習) - Java(Webアプリ) - Ruby(RailsだけだからRubyはできない)
- あとterraformとかansibleとか.... - 普段はML系の基盤とか火消しとか - GCP x k8sはじめました - 趣味でゲート式量子コンピュータしてます 安田 京太(@dasoran2)
はなすこと - ある日の出来事 - Serverlessとの出会い - やってみた - つらかったこと1 -
つらかったこと2 - まとめ
ある日の出来事 - 簡単なレコメンドAPIを作ることに 適当な集計 (協調フィルタとか) 類似関係のデータ (IDで引ける) 外部 APIサーバー HTTP
チーム内の会話 こんな簡単なシステムでいちいち ECS task書きたくないなぁ.... 最近 って フレームワークがいいらしい APIはこれでいくか....? terraformもいっぱい書きたくない
最近 って フレームワークがいいらしい APIはこれでいくか....? terraformもいっぱい書きたくない チーム内の会話 こんな簡単なシステムでいちいち ECS task書きたくないなぁ.... 面倒臭さと好奇心に敗北した エンジニア各位
やってみた データソース 集計batch (日次) 集計結果 API処理
やってみた データソース 集計batch (日次) 集計結果 API処理 Serverlessで楽できる
やってみた データソース 集計batch (日次) 集計結果 API処理 Serverlessで楽できる lambdaがいっぱい立ち上がるから RDSじゃなくDynamoDB
やってみた データソース 集計batch (日次) 集計結果 API処理 Serverlessで楽できる lambdaがいっぱい立ち上がるから RDSじゃなくDynamoDB アプリのdeployから分離するため
結局terraform管理
やってみた データソース 集計batch (日次) 集計結果 API処理 Serverlessで楽できる lambdaがいっぱい立ち上がるから RDSじゃなくDynamoDB 実行時間で諦めたECS
アプリのdeployから分離するため 結局terraform管理
やってみた データソース 集計batch (日次) 集計結果 API処理 Serverlessで楽できる lambdaがいっぱい立ち上がるから RDSじゃなくDynamoDB 実行時間で諦めたECS
アプリのdeployから分離するため 結局terraform管理 あれ、あまり楽になってない....
つらかったこと1: Lamda不安定問題 - 偶発的にレスポンスが極端に劣化する - Lambdaのコールドスタートに起因する様子 - リクエストが多いとわからないため負荷テスト時には発覚せず - pingを打って回避を試みても偶発的に発生する
- ググってもLambdaの仕様で起こるっぽい的な記事がでてくるが真偽は謎 - だれか解決策知ってたら教えてください
つらかったこと2: DynamoDB高すぎ問題 - 毎日すべてのコンテンツの類似コンテンツを集計した - 1日3時間程度 12000 Write Capacity が必要に
- 差分更新できれば良かったが .... - 結果、月$700程度DynamoDBのコストが発生
つらかったこと2: DynamoDB高すぎ問題 - 毎日すべてのコンテンツの類似コンテンツを集計した - 1日3時間程度 12000 Write Capacity が必要に
- 差分更新できれば良かったが .... - 結果、月$700程度DynamoDBのコストが発生 全件更新系のBatchには DynamoDBの課金体系は向かない
つらかったこと2+: スループット管理怖すぎ問題 - (先日の新しい課金プランで解決した) - Writeしている際に予期しないエラーでハンドリングできず batchが落ちた - Write Capacityが大きい状態のまま放置される
- ひどい金額の課金が発生した スループット管理は慎重に ....
まとめ - 少なくともDynamoDBは全件入れ替え系の集計には向かない - Lambdaが不安定なので以下の場合は向かない可能性がある - レスポンスタイム要求がシビア - リトライ等が難しい -
知らない方法で解決できると嬉しいな - 結局Serverlessと同じくらい容易にDeployできる基盤を構築したほうが、 現在の環境では利用可能範囲が広そう - Serverlessくらいの記述量で扱えるコンテナ基盤がほしい .... - がんばって研究中!