Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめまして 株式会社リンクです。Mackerelはじめました。 / Mackerel Day...
Search
mackerelio
December 23, 2019
Technology
0
2.9k
はじめまして 株式会社リンクです。Mackerelはじめました。 / Mackerel Day #2 2019.12.23 登壇資料(株式会社リンク)
Mackerel Day #2 (2019.12.23開催)での、株式会社リンク様のご登壇資料です。
mackerelio
December 23, 2019
Tweet
Share
More Decks by mackerelio
See All by mackerelio
Mackerel CREのご紹介
mackerelio
0
6
Mackerelが取り組むオブザーバビリティ - Mackerel Tech Day
mackerelio
0
680
Mackerelの2023年ふりかえりと 今後のロードマップ
mackerelio
0
990
Mackerel開発者が使ってほしいAWSインテグレーションの機能4選
mackerelio
0
67
Mackerelの現在と未来 2023 / Mackerel Drinkup #10
mackerelio
0
160
次世代Mackerelの アーキテクチャ / Mackerel Meetup #14 Next Generation Architecture
mackerelio
0
2.2k
Mackerelの現在と未来 2023 / Mackerel Meetup #14
mackerelio
0
2.2k
【講演資料】クラウド運用事業の成長を支援!MackerelではじめるMSP_20210427
mackerelio
0
140
オンラインセミナー資料「はじめてのMackerel 〜アラートの洪水から脱出! Mackerel流の通知活用法〜」20210303
mackerelio
0
100
Other Decks in Technology
See All in Technology
ソフトウェア開発における「パーフェクトな意思決定」/Perfect Decision-Making in Software Development
yayoi_dd
2
2.3k
20241218_今年はSLI/SLOの導入を頑張ってました!
zepprix
0
210
プロダクト組織で取り組むアドベントカレンダー/Advent Calendar in Product Teams
mixplace
0
500
なぜCodeceptJSを選んだか
goataka
0
190
怖くない!ゼロから始めるPHPソースコードコンパイル入門
colopl
0
190
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
170
多領域インシデントマネジメントへの挑戦:ハードウェアとソフトウェアの融合が生む課題/Challenge to multidisciplinary incident management: Issues created by the fusion of hardware and software
bitkey
PRO
2
130
DUSt3R, MASt3R, MASt3R-SfM にみる3D基盤モデル
spatial_ai_network
2
350
メンタル面でもつよつよエンジニアになる/登壇資料(井田 献一朗)
hacobu
0
150
TypeScript開発にモジュラーモノリスを持ち込む
sansantech
PRO
3
760
最近のSfM手法まとめ - COLMAP / GLOMAPを中心に -
kwchrk
8
1.5k
スタートアップで取り組んでいるAzureとMicrosoft 365のセキュリティ対策/How to Improve Azure and Microsoft 365 Security at Startup
yuj1osm
0
250
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
335
57k
Making the Leap to Tech Lead
cromwellryan
133
9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Adopting Sorbet at Scale
ufuk
74
9.1k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.9k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
The Language of Interfaces
destraynor
155
24k
Raft: Consensus for Rubyists
vanstee
137
6.7k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Transcript
✕ はじめまして 株式会社リンクです。 Mackerelはじめました。
2 本⽇お話しすること Part . MSPの変化とMackerel採⽤のなぜ? Part . Mackerelをどうつかう?
3 ⾃⼰紹介 ‧⼭本 誠⼀郎(やまもと せいいちろう) ‧1976年⽣まれ 43歳 ‧2児(3歳男と6歳男)の⽗ ‧株式会社リンク サポート部 部⻑ (ワンスタッド株式会社 代表取締役) 【経歴】 派遣会社のCMが湯⽔のように流れた2000年、抗うことなく派遣会社に⼊社し、 ⼊社1週間で国営の電話会社に派遣され社会⼈⼀年⽬がはじまる。
都会派サラリーマンを⽬指すが、2ヶ⽉後にはスーツを脱がされ 、作業着でLANケーブルの作成‧ 敷設、ネットワーク機器の設定や設置、障害対応で⾛り回る毎⽇ 2004年にMSP(マネージド‧サービス‧プロバイダ)へ転職し、運⽤のノウハウをに⾒つけ、 仕事の厳しさ‧楽しさ‧⾯⽩さを感じる。 SIerやコンサルなどの経験を積み、2014年に株式会社リンクに⼊社し、ベアメタルクラウドの⽴ち上げ に関わる。 気づいたらインフラに関わり続けて20年‧‧‧‧
4 株式会社リンクって? ݄ۀ ɹࠓͰ ظͷاۀͰ͢ɻ *5ΠϯϑϥࣄۀΛϕʔεͱͨ͠෯͍*5αʔϏεΛఏڙ͍ͯ͠·͢ɻ 1996年に富⼭に本社を構えるエーティーワークスとの協業で専⽤サーバサービスをスタート。 ピーク時の運⽤対象サーバは2万台を超える。 2006年にスタートしたクラウド型テレフォニーサービス。 導⼊社数1,200‧稼働席数24,000を突破し、3年連続シェアNo.
を達成したクラウド型CTI「BIZTEL」。 「PCI DSS Ready Cloud」は、クレジットカードの会員情報を安全に取り扱うことを⽬的として策定された、クレジット カード業界の世界的なセキュリティ基準「PCIDSS」に準拠するために必要なリソースをクラウド上で提供するサービス。 岩⼿県岩泉町で、1年を通して⼭に⽜を放牧する⾃然放牧酪農の牧場を運営しています。 2014年から物理サーバをベースとしたクラウドサービス「リンクベアメタルクラウド」をスタート 物理サーバの安定した性能と仮想サーバの⼿軽さを併せ持つサーバサービス。
5 2000年頃のサイトって? 2000年頃のホームページはこんな感じでした クライアント側の回線も細かったため、画像も少ない クリック→表⽰待ち→クリック→表⽰待ち→‧‧‧
6 2000年前後のMSPって? データセンタにサーバを設置する考えが⼀般的:⾃社で監視 SMBでホームページなどの⽤途でホスティング:ホスティング業者で監視 監視ツールは今と⽐べると⾮常に⾼価だったため、監視サービスの利⽤料も⾼額 ▪監視(1OS) 万円 ▪DCオンサイト 5万〜10万円 1台 10万円前後 監視サービスの⽐較も
‧監視項⽬の種類 ‧監視項⽬の数 運⽤を提供する側は ‧24時間体制の監視ルームはあったが、アラートメール/監視 マップ/警⼦ちゃんをトリガーにエンジニアへエスカレーション ‧エンジニアは肌⾝離さず⾮常に重いPCを持ち歩き対応
7 ワンオペ&1⼈24時間365⽇もチラホラ(経営者にとっては 都合の良い?)時代 とはいえ、時代が時代ですから緩い⼀⾯も… お客様との飲み会後、⾒送られたその⾜でデータセンタへ帰 宅していた(良い)時代 酔っ払いながらDCに⼊館しても守衛の⽅からは「お疲れさま です。⼤変ですね〜」と声を掛けられていた(良い?)時代
8 MSPシステムの変化 システムを監視する⽅法は ①商⽤ツールにて⾃社で監視 ②OSSを組み合わせて⾃社で監視 ③ホスティング業者で監視 ①はツールのコストが⾼く、体制維持も⼤変 ②は開発コストが⾼く、品質維持は難しく、体制維持も⼤変 ③はシンプルに⾼かった システムの監視はお⾦がかかった
最近では‧‧‧ • AWS/Azure/GCPなどのマネージド型インフラの普及 • 運⽤はインフラは事業者へ • 安価に監視サービスの利⽤が可能に
9 クラウドがもたらしたもの .クラウド利⽤の増加 インフラエンジニアメインのシステムから アプリケーションエンジニアメインのシステムへ
10 監視ツールはZやNの旧来の監視ツールが使われており、 アプリケーションエンジニアにとっては”少しだけ”解り⾟いモノ .監視ツールは未だ旧来のツールが多い
11 システム管理者が知りたいのは サーバやネットワークの健全性ではなく、システムの健全性 .もはやインフラは意識していない
12 今からは インフラエンジニアも アプリケーションエンジニアも 利⽤し易く、共有可能な直感的かつ視覚的なツールが必要 .やっぱ、今ドキじゃないとダメっす!
13 だから弊社も はじめました…
14 弊社の監視システム 対象サービス:ベアメタルクラウド 監視サービス:サーバご利⽤中のお客様に以下をご提供 • 標準監視:HW関連/死活/リソース(CPU/メモリ/HDD/Traffic) • 拡張監視:ログ監視/プロセス監視などを始めとするユーザサービスに特化した項⽬ • 障害対応:⼿順書および⼝頭指⽰でのオペレーション実⾏
• 技術⽀援サービス:24時間365⽇エンジニアが直接電話を受け対応 • ミドルウェアの設計/構築/チューニング • 障害対応はもちろん、切り分けや原因調査なども • ユーザ数:400社 • システム系: 500ノード • ユーザ系:2100ノード 監視対象数
15 弊社の監視システム 監視システム構成 ベアメタルクラウド内にnagios manager: 台/nagios worker: 台/nagios proxy: 台/NFS:
台 さくらさんおよびAWSさん上に監視の監視:2台2式 *OUFSOFU OBHJPTNBOBHFS º OBHJPTXPSLFS º ɾɾɾɾ OBHJPTQSPYZ º [BCCJY º ͓٬༷γεςϜ ɾɾɾɾ
16 監視システム維持費⽤ • 物理サーバ:15台 • クラウドサービス:5インスタンス • ラック:1/2 • 管理者:0.5⼈⽉
• 開発費⽤:100万 • 年間保守費⽤:200万 年間3,000万〜4,000万円 参考)監視サービスを含めたポータルシステムを構築した場合は年間1億程度
17 Mackerel採⽤のメリット • 監視システムの縮⼩ • エンジニアリソース縮⼩ • 監視トレンドの調査や検証の効率化 • インシデント管理ツールとの連携
Slack、Chatwork、Reactioなど コストダウン & 効率化 これらのコストを既存サービスの強化や新サービスの開発へ分配し、⾃社の強みを強化‧構築することに集中 • サポートチームの強化 • 運⽤設計チームの強化 • サービス企画チームの強化 年間1,500万円削減
18 しかし、もっとも期待するところは‧‧‧ 私達が監視サービスを提供するために使う多くの時間を、 ルーティーン業務からイノベーティブな 業務に変化させ、新しい価値の創造
19 これからのLINKにご期待ください LINKはAWSを初めとする⼤型クラウド全盛の中、オンプレミスに近いシステムを必要とされる お客さまとエンジニアと直接会話できるサポートを必要とされるお客さまの⼀社⼀社‧⼀⼈ひ とりの声を聞き、エッジの効いたサービスを提供し続けます。 お客さまと同じ⽬線でシステムを守り続けるリンクにご期待ください!
20 続いて 弊社、菱沼よりmackerelの活⽤事例について お話しさせていただきます。
21 mackerelの活⽤事例
22 サービス基盤の監視に を利⽤してみた! からの移⾏と コンテナの監視!
23 ⾃⼰紹介 [⽒名] 菱沼 憲司(ひしぬま けんじ) [出⾝地] ⻘森県上北郡おいらせ町(旧百⽯町) [経歴] SIer:インフラ&プロジェクトのイロハを勉強 MSP:インフラ運⽤、サービスの重要性を勉強 クラウド:クラウド基盤の開発、サービス企画‧開発を勉強
現在:エバンジェリストから役職者へ(技術部⻑) [趣味(続けていること)] ゴルフ:⼦供が⽣まれてからは半年に2回くらい スノーボード:毎シーズン3回程度 ランニング:以前は110キロ⾛ってましたが、最近はサボり気味‧‧‧
24 ⽬次 . 移⾏対象サービス基盤の説明 . Nagiosで監視している内容 . mackerelへ移⾏した結果 . まとめ
. 最後に
25 アジェンダ① 移⾏対象サービス基盤の説明
26 ཧαʔό サービス基盤のご紹介 ユーザへ⾼い到達率を実現する「メールリレーサービス」です。 リーズナブル な価格 多機能 ⾼い 到達率 ベアメールの3つの特⻑
例えば、会員登録時の完了メールや商品購⼊や予約時の確認メールなど、ユーザに確実にメールを届けたい場合にキャリアからのブロックを避け、⾼い到達率でメー ル配信を⾏うことができるようになります。メール配信の設定や配信統計の確認、ログ検索、ログダウンロードまで、お使いのコントロールパネルから⾏うことがで きます(※リンクベアメタルクラウドをお使いでないお客さまでもご利⽤いただけます)。
27 サービス基盤のご紹介 リレーメール配信利⽤例 Gmail docomo KDDI SoftBank ✖ メールが届かない ✖
ブロック Gmail docomo KDDI SoftBank 到達率UP ベアメール IP IP IP リレー配信 複数のIPから配信 同⼀のIPから配信 海外IPから配信 利⽤例 ✓ 会員向けの⾃社商品PR⽤のメール配信 ✓ 会員向けに広告⽤のメール配信 会員向けのメルマガなどで⼤量にメールを配信をする場合、同⼀IPから配 信するとキャリアからブロックされ、配信ができなくなるといったケース があります。 例えば、ECサイトなどの場合、会員向けのメール配信は売上に影響します ので、メールの到達率の向上はサービス運営に重要な要素です。 ⾃社サービス ECサイト メルマガ配信 トランザクション メール → → 開封率‧売上アップ 売上に影響 SMTPサーバ
28 サービス基盤のご紹介 4FOEFS&OHJOF 4FOEFS&OHJOF ⼤量IPを利⽤して⼤量メールを配信 ※約4000万通/⽉ 4FOEFS&OHJOF 4FOEFS&OHJOF (MPCBM$*%3Yେྔ 8FC
"1* ෦%/4 %PDLFS ίϯςφ /BHJPT
29 サービス基盤のご紹介 4FOEFS4FSWFS <6TFS"> 1PTUpY $POUBJOFS <6TFS#> 1PTUpY $POUBJOFS <6TFS">
1PTUpY $POUBJOFS <6TFS#> 1PTUpY $POUBJOFS 65.ʢ-#ʣ 6TFS"(*1 6TFS#(*1 SMTP Auth %PDLFS)PTU %PDLFS)PTU SMTP Docker Log syslog転送 プライベートリポジトリ コンテナイメージ保管 コンテナイメージ ダウンロード %PDLFS45( <%FW> 1PTUpY$POUBJOFS イメージ アップロード ‧特定処理でしか利⽤しないためVMは不要 ‧リソース削減、コスト削減が最重要課題 ‧単純にリソースを集中できる物理サーバと相 性が良い ίϯςφ࠾༻ͨ͠ཧ༝ ‧Dockerのペストプラクティスをどこまで追求す るか ‧メールシステムのためIPアドレスの存在が必須 ‧Kubernetesなどのクラスタ、運⽤管理は利⽤ しない ‧役割分割、冗⻑化、コンテナデリバリ⾃動 化は独⾃で構築 ߏஙͷϙΠϯτ
30 アジェンダ② Nagiosで監視している内容
31 Nagiosで監視している内容 "-*7&ࢹ αʔόͷՔಇঢ়گΛࢹ ɾ1JOHࢹ ɾ44)ࢹ ɾϋʔυΣΞࢹ ͳͲ ΞϓϦɾϛυϧΣΞͷՔಇ ঢ়گΛࢹ
ɾΞϓϦͷϓϩηεࢹ ɾϛυϧΣΞͷϓϩηε ࢹ ɾ5$16%1ϙʔτࢹ ͳͲ 04ͷՔಇঢ়گΛࢹ ɾ$16-PBE"WFSBHF ɾϝϞϦ༻ ɾσΟεΫ༻ ɾωοτϫʔΫCQT ͳͲ ϓϩηεɾϙʔτ ࢹ ϦιʔεɾτϥϑΟοΫ ࢹ 04ɾΞϓϦͷϩάΛΩʔϫʔ υݕͰࢹ ɾγεςϜϩάࢹ ɾΞϓϦϩάࢹ ͳͲ ϩάࢹ ࢹ࣮ͷϙΠϯτ ɾΞϥʔτ༰Ͱ͋ΔఔΓ͚ग़དྷΔ͜ͱΛॏࢹʂ
32 Nagiosで監視している内容 ֎ܗࢹ ϓϥάΠϯࢹ ίϯςφࢹ ఏڙαʔϏεͱಉ༷ͷܦ࿏͔Β ଓࢹ ɾ֎෦͔Βͷ4.51ଓࢹ ɾ֎෦͔Βͷ"1* IUUQT
ଓ ࢹ ͳͲ /BHJPTϓϥάΠϯɾಠࣗ։ൃϓ ϥάΠϯࢹ ɾ࣌ࠁಉظঢ়ଶͷࢹ ɾ%#SFQMJDBUJPOࢹ ɾ෦%/4ͷ໊લղܾͷࢹ ɾϝʔϧΩϡʔͷࢹ ͳͲ %PDLFSͰಈ͍͍ͯΔίϯςφͷ Քಇঢ়گΛࢹ ɾૄ௨ࢹ ɾϙʔτࢹ ɾεςʔλεࢹ ɾϝτϦοΫࢹ ͳͲ ࢹ࣮ͷϙΠϯτ ɾΞϥʔτ༰Ͱ͋ΔఔΓ͚ग़དྷΔ͜ͱΛॏࢹʂ
33 Nagiosで監視している内容 ಉ͡ػೳͷαʔόΛॏͶ߹ΘͤͨΓɺಠࣗϓϥάΠϯ ͷσʔλΛՄࢹԽͰ͖ͳ͍ʁʁʁ αʔϏεͷਖ਼ৗੑΛݟ͑ΔԽ͍ͨ͠ʂ 僕 Nagios担当 /BHJPTͰग़དྷͳ͘ͳ͍͕ɺಛ ʹάϥϑ෦ͷ࡞ΓࠐΈ͕େมɻ ͔͠ɺྔ͕ଟ͍ͱ݁ߏαʔόෛՙ͔͔Δ
͔ɻɻɻ ͦ͏͔ͬ͢ɻɻɻ Ͳ͔͍͠ͳ͊ɻɻɻ /BHJPTͷ՝
34 Nagiosで監視している内容 ίϯςφՃͨ࣌͠ʹɺࢹઃఆ Λґཔͯ͠ΔΜͰ͕͢ɺखؒଟ͍ͷͰࣗಈ Խ͍ͨ͠ΜͰ͕͢ɻɻɻ 僕 Nagios担当 ࣗಈԽ෦࡞Γࠐ·ͳ͍ͱμϝͩ ͔Βɺ࣌ؒ͋Δ࣌ʹ࡞ΓࠐΉΑɻ ͦɺͦ͏ͬ͢ΑͶ͐ʙ
͋ͱɺίϯςφ͝ͱͷϦιʔεॏͶ ߹ΘͤͰՄࢹԽ͍ͨ͠ΜͰ͕͢ʂ ͬͱେม͔ͩΒʂʂʂ /BHJPTͷ՝
36 アジェンダ③ mackerelへ移⾏した結果
37 mackerelへ移⾏した結果 感 動 (; . ;)
38 mackerelへ移⾏した結果 同じ機能のサーバのCPU負荷を重ね合わせて可視化したい!
39 mackerelへ移⾏した結果 サービスの正常性を分析するために作り込んだ独⾃プラグインも可視化したい!
40 mackerelへ移⾏した結果 【CPU監視】 【メモリ監視】 Docker コンテナごとの リソースみたい! しかも、コンテナ増減で⾃動で 更新されてる!!!
42 mackerelへ移⾏した結果 ※注意 当然ですが、mackerel だから何でも出来るわけではないです。 ‧mackerelでもデータを渡すための作り込みは必要 ‧UIですべて設定できるわけではなく、エージェント側で設定する内容も多い ‧コンテナ監視は可視化はできるけど、ALIVE系の監視は作り込まないとダメ
43 アジェンダ④ まとめ
44 ཧαʔό まとめ アラートで可能な限り切り分けで きるように作り込んだ監視 データを集めて可視化し分析 グラフ化したいもの、できるものはもちろん、そ れ以外も基本はmackerelへ移⾏! ALIVE監視、ハードウェア監視は 既存Nagiosのままオンプレミス運⽤!
45 最後に! サービスの正常性を維持するために、通常と異なったメールキューの滞留出た場合に気づきたい! mackerelの「ロール内異常検知」であれば実現可能!? 【メールキュー監視】 【ロール内異常検知】
46 最後に! ͱ͍͏͜ͱͰɺʮϩʔϧҟৗݕʯͰ Ζ͏ͱ͓͏ΜͰ͕͢ग़དྷ·͢ΑͶʂʁ 僕 はてな社 エンジニア様 γεςϜϝτϦοΫͳΒ ग़དྷ·͢Αʂ Μʁ
࡞ΓࠐΜͩΧελϜϝτϦοΫͩͱʁ ·ͩग़དྷͳ͍Ͱ͢ɻɻɻ
48 ͝੩ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ CBSFNFUBMKQ CBSFNBJMKQ CBSFTVQQPSUKQ