Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RancherDay2019-AlpacaJapan.pdf
Search
sasaki
July 24, 2019
Technology
2
1.2k
RancherDay2019-AlpacaJapan.pdf
sasaki
July 24, 2019
Tweet
Share
More Decks by sasaki
See All by sasaki
プラットフォームってつくることより計測することが重要なんじゃないかという話 / Platform Engineering Meetup #8
taishin
1
500
ECS Runtime Monitoring で コンテナランタイムセキュリティに入門 / nakanoshima-dev-ecs-runtime-monitoring
taishin
0
85
JAWS-UG-Osaka-guardrail
taishin
0
190
成長を続けるSaaSのAWSコスト管理において 開発者としてできること / AWS DevDay SaaS Cost
taishin
10
2.2k
IaCのCI/CDを考えよう / JAWS-UG_Okayama_IaC_CICD
taishin
1
1.1k
目指せCoverage100%! AutoScale環境におけるSavings Plans購入戦略 / JAWS-UG_SRE_Coverage
taishin
1
1.7k
SLO策定までの道とChaosEngineeringを使った最適解の見つけ方 / SLO ChaosEngineering
taishin
1
1.6k
ChatworkDevDay_Kubernetes導入における実践プラクティス / ChatworkDevDay_Kubernetes
taishin
0
6.8k
EKSクラスタのつくりかた / JAWS-UG-Nagoya EKS Cluster
taishin
1
120
Other Decks in Technology
See All in Technology
Shinagile 2024
kawaguti
PRO
2
120
kcp: Kubernetes APIs Are All You Need #techfeed_live / TechFeed Experts Night 28th
ytaka23
1
190
[2024년 5월 세미나] 생성형 AI와 함께하는 데이터 분석가 커리어
datarian
0
1.2k
QA経験のないエンジニアリング マネージャーがQAのカジュアル面談に出て 苦労していること・気づいたこと / scrum fest niigata 2024
yoshikiiida
2
660
DevRelによる信頼構築とデータ駆動で変わるエンジニア採用 / DevRel Trust Building to Data Driven Engineering Hiring
bobtani
1
130
cgroup v2 で何が変わったのか / TechFeed Experts Night #28
tenforward
2
160
能動学習のいろは:書籍「Human-in-the-Loop機械学習」3〜5章
hiroyoshiito
0
290
Dungeons and Dragons and Rails
joelq
0
230
大規模言語モデル (LLM)における低精度数値表現
pfn
PRO
3
820
開発スピードの維持向上を支える、テスト設計の 漸進的進化への取り組み / Continuous Test Design Development for Speed of Product Development
ropqa
0
180
20240509 CloudWatch でいろいろなものを監視してみよう
masaruogura
1
120
Password cracking: past, present, future
openwall
0
270
Featured
See All Featured
BBQ
matthewcrist
80
8.8k
Mobile First: as difficult as doing things right
swwweet
217
8.6k
Building Effective Engineering Teams - LeadDev
addyosmani
33
1.9k
Stop Working from a Prison Cell
hatefulcrawdad
266
19k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
8
3.5k
Unsuck your backbone
ammeep
664
57k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
51k
How GitHub (no longer) Works
holman
305
140k
Intergalactic Javascript Robots from Outer Space
tanoku
266
26k
How GitHub Uses GitHub to Build GitHub
holman
468
290k
Clear Off the Table
cherdarchuk
86
310k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
221
21k
Transcript
2019/7/24 Alpaca Japan Shinya Sasaki AlpacaJapanの機械学習環境になぜ Rancherが必要なのか?
Who? Shinya Sasaki Head of Infrastructure Engineering at AlpacaJapan Co.,
Ltd. Osaka, Japan 2
Alpaca Japan 3 3 3 金融 x 機械学習 がテーマのスタートアップ 主な提供サービス/プロダクト
❖ 銀行・証券会社・信託銀行を中心に 金融機関向けのトレーディング AI技術で多くの実績を保持 「相場予測モデルの構築」 のプロジェクトで 協業 「AlpacaSearch for kabu.com」 相互に類似している銘柄のチャートパターン を表示 「AI外貨予測」「AI外貨積立」 指定した外貨の為替の変動を予測し、予測 した日に一定金額を積立 可能 主要マーケットの短期予測 をリアルタイムで表示 弊社の大規模データ処理 の技術やディープラーニン グ技術を活用したアプリ ケーション
Top-10 Artificial Intelligence Startups in Japan 4 https://www.nanalyze.com/2019/02/artificial-intelligence-japan/
The Fintech 250: The Top Fintech Startups Of 2018 5
https://www.cbinsights.com/research/fintech-250-startups-most-promising/
日経6/5 6
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
このあとの動きを予測する 9 ? ? ? ? ? ?
下落 10
テクニカルトレーダーの着目点 11
市場予測 = 値動きの前兆となるパターンを捉える 12
パターン探し 13 仮にパターンが分かっていたとしても ハードロジックをプログラムするには条件が多様 or 曖昧すぎる 未知のパターンを見つけたい → 機械学習
関連性の把握 14 Tick
Tick? 15 https://kotobank.jp/word/ティック-574561
Tickパターンの解析 • 大量のTickデータから発生パターンを解析し、どのようなパターンが発生したときにプライス が上がるか・下がるかを予測 • 大量のTickパターンを四六時中監視するのは、人間には不可能に近い 16 Tick発生パターン 学 習
マーケットの上げ・下げをTickの発生パ ターンから予測するモデル
予測モデルの作成 17 予測モデルの 出力を変換 ①時系列データの準備 ②処理済みデータ ③学習済みのモデル (Deep Learning) ④最終調整
18
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
AlpacaJapanのインフラ 基本的にはKubernetes上に構築 (移行中のもありますが) • 予測モデル作成 • GPUが大量に必要 • バッチ処理 •
大量データの集計 • CPUが大量に必要 • サービス提供 • 結果をユーザに提供 • Webアプリケーション 20 オンプレ Amazon EKS Amazon EKS
マネージドKubernetesサービスがあるの にRancherっている?
マネージドKubernetesサービスがあるの にRancherっている? いらんやろ
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
kubernetes運用を始めると出てきた課題 24 1. クラスタの増加 2. 利用ユーザの増加 3. 利用シーンの増加
1. クラスタの増加 どのレベルでクラスタをつくるか? • シングルクラスタ • 1つ、もしくはある程度大きなクラスタで運用 • 用途ごとにNamespaceを分ける •
マルチクラスタ • 用途ごとに個々にクラスタをつくる • サービスごと • 環境(Production、Staging、Development)ごと 25
1. クラスタの増加 どのレベルでクラスタをつくるか? • シングルクラスタ • 1つ、もしくはある程度大きなクラスタで運用 • 用途ごとにNamespaceを分ける •
マルチクラスタ • 用途にごと個々にクラスタをつくる • サービスごと • 環境(Production、Staging、Development)ごと 26
シングルクラスタのデメリット • バージョンアップ等のメンテナンス、障害時の影響大 • 作業調整が大変 • 影響が把握できない • ポリシーの管理が複雑 •
セキュリティグループ、IAMポリシー • 現状、コンテナレベルの制御はちょっと手間 • AWSアカウントは分けれない 27
マルチクラスタのデメリット • 複数のAPI URL、kubeconfig • コスト増 • EKSはクラスタだけで費用が発生 • 0.20
USD/hour (2019.07現在) • 16k/month くらい • ワーカーノードのリソースにムダが出やすい 28
2. 利用ユーザの増加 • 運用負荷の増加 • 利用方法の説明 • クラスタ追加時のアクセス方法の通知 • kubeconfigの配布
• アクセス権 • ユーザごとに権限を変えたい • Namespaceレベル • リソースレベル • RW/RO → RBAC 29
EKSでのユーザアクセス制限 1. AWS側でIAMユーザを作成 2. kubernetes側でRBAC設定適用 3. kubernetes側でconfigmap/aws-authを編集し、IAM ユーザに紐づけ 30 $
kubectl edit -n kube-system configmap/aws-auth • 問題点 • aws-authはワーカーノードのIAMロールも含まれるので、Git管理しにくい • あとから確認しにくい https://docs.aws.amazon.com/ja_jp/eks/latest/userguide/add-user-role.html
3. 利用シーンの増加 • 環境の違い • 普段はセットアップされたローカルPC or Macからkubectlを実行 • 一時的にローカル環境使えない場合とか
• ユーザーごとのKubernetes理解度、利用頻度の違い • kubectl? なにそれ? • このコンテナ実行したいだけなんだけど • このyaml実行したいだけなんだけど 31
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
1. クラスタの増加への対応 • 複数のAPI URL、kubeconfig • コスト増 • EKSはクラスタだけで費用が発生 •
0.20 USD/hour (2019.07現在) • 16k/month くらい • ワーカーノードのリソースにムダが出やすい 33
1. クラスタの増加への対応 • 複数のAPI URL、kubeconfig • コスト増 • EKSはクラスタだけで費用が発生 •
0.20 USD/hour (2019.07現在) • 16k/month くらい • ワーカーノードのリソースにムダが出やすい 34 RancherのURLさえわかっていれば
1. クラスタの増加への対応 • 複数のAPI URL、kubeconfig • コスト増 • EKSはクラスタだけで費用が発生 •
0.20 USD/hour (2019.07現在) • 16k/month くらい • ワーカーノードのリソースにムダが出やすい 35 しゃあない
マルチクラスタの課題への対応 • 複数のAPI URL、kubeconfig • コスト増 • EKSはクラスタだけで費用が発生 • 0.20
USD/hour (2019.07現在) • 16k/month くらい • ワーカーノードのリソースにムダが出やすい 36 Spotinst社のOceanを利用
Ocean Spotinst社が提供する、EKSのワーカーノードにスポットインスタンスを活用し、運用負荷や利用料金を削減し てくれるサービス。 コンテナの負荷状況に応じてスケール、ノードサイズの決定等を自動で行ってくれる。 37 Jobリクエスト インスタンス起動 ノード登録
2. 利用ユーザの増加への対応 • 運用負荷の増加 • 利用方法の説明 • クラスタ追加時のアクセス方法の通知 • kubeconfigの配布
• アクセス権 • ユーザごとに権限を変えたい • Namespaceレベル • リソースレベル • RW/RO → RBAC 38
2. 利用ユーザの増加への対応 • 運用負荷の増加 • 利用方法の説明 • クラスタ追加時のアクセス方法の通知 • kubeconfigの配布
• アクセス権 • ユーザごとに権限を変えたい • Namespaceレベル • リソースレベル • RW/RO → RBAC 39 外部認証に対応 クラスタごと、プロジェクトごと にユーザ権限が設定可能
2. 利用ユーザの増加への対応 • 運用負荷の増加 • 利用方法の説明 • クラスタ追加時のアクセス方法の通知 • kubeconfigの配布
• アクセス権 • ユーザごとに権限を変えたい • Namespaceレベル • リソースレベル • RW/RO → RBAC 40 ユーザに権限を付与すれば、 アクセス可能なクラスタ /プロ ジェクトのみ表示
3. 利用シーンの増加への対応 • 環境の違い • 普段はセットアップされたローカルPC or Macからkubectlを実行 • 一時的にローカル環境使えない場合とか
• ユーザーごとのKubernetes理解度、利用頻度の違い • kubectl? なにそれ? • このコンテナ実行したいだけなんだけど • このyaml実行したいだけなんだけど 41
3. 利用シーンの増加への対応 • 環境の違い • 普段はセットアップされたローカルPC or Macからkubectlを実行 • 一時的にローカル環境使えない場合とか
• ユーザーごとのKubernetes理解度、利用頻度の違い • kubectl? なにそれ? • このコンテナ実行したいだけなんだけど • このyaml実行したいだけなんだけど 42 ブラウザ上でのkubectl yamlファイルのコピペ GUIでのコンテナ、パラメータ指定 複数のデプロイ方法に対応
現在の構成 43
Agenda 1. AlpacaJapanの市場予測 2. AlpacaJapanのインフラ 3. Kubernetes運用の課題 4. Rancherでの課題解決 5.
まとめ
まとめ • マネージドKubernetesを使っていても出てくる課題 • クラスタの増加 • 利用ユーザの増加 • 利用シーンの増加 •
Rancherと組み合わせることでこれらの課題に対応できた 45
46 We're hiring!! https://www.wantedly.com/companies/alpacadb • Web Engineer • Infrastructure Engineer
• ML/AI Engineer • Fintech Engineer
Thank you