Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ハードウェア管理のお話 #TechLunch

ハードウェア管理のお話 #TechLunch

ハードウェア管理のお話
2013/01/16 (水) @ Livesense TechLunch
発表者:鈴木 翔一郎

E60aa4f80303f3f386898546ddb3686a?s=128

Livesense Inc.
PRO

April 21, 2014
Tweet

Transcript

  1. システム開発部  鈴木  翔一朗

  2. — MegaRAID   — Remote  Console   — IPMI   — 物理不良対応   — 物理不良事例

      — クラウド事業者  事例   — バッテリー切れのお知らせ  
  3. — 冗長化の実現   — ストライピングによる高速化   — 一次キャッシュによる高速化   — HPのみ独自技術採用(smart  array)   — RAID

     level,  cache  size,  bus  speedに よって値段が大きく変わる
  4. — RAID  level   — Write  policy   — ref  :   http://jp.fujitsu.com/platform/server/

    primergy/hdd_construct/raid01.html   — Demo  
  5. — console画面を提供   — 仮想電源  On/Off   — vendor  毎に仕様/用語が異なる   — Demo

  6. — power,  cpu,  memory等の情報を取得   — RAID,  Diskに関しては情報取得不可   — Demo  

  7. — ロット単位の不良   — 部品設計の不具合   — ファームウェア不具合

  8. — 基本的に未知の障害である事が多く、事前 検知はほぼ不可能に近い   — 障害発生が頻発している状況を受けてから メーカーが本腰を入れて調査するので、障 害検知から原因究明まで半年以上かかる事 もある  

  9. — ユーザ企業側で出来る事   —  サーバ割当を変更し、物理的な不良かどう かを切り分ける  (簡単な切替をできるシス テム構成/組織体制が大前提)   —  ベンチマークツールを用いて性能劣化を証

    明する  (  正常サーバと異常サーバの両方で の性能検証が必要  )     —  監視可能ならば統合監視ツールで不良検知   —  監視不能ならばバッチ等で定期チェック
  10. — NEC   —  電源供給部品の不具合によりサーバが燃え る   —  CPU周波数が下がる(原因調査中)  

  11. — HP   —  iLO(remote  console)のファーム不良により 突然再起動する  (c01955503)   —  RAID

     card不具合により、一部セクタが読 めなくない  (現象が発生するとOS停止)   —  RAID  card不具合により、Disk破損がなく ても赤いランプが点灯する  
  12. — Fujitsu   —  ServerView(remote  console)のdefault   gatewayが勝手に変わり疎通不能になる。 ServerViewのバージョンアップで解消。   — DELL

      —  CPU  /  memory  間を制御するファームウェ ア不具合により、ASR  rebootがかかる事が ある。ファームバージョンアップで解消。  
  13. — ドリコム合同勉強会   —  相乗りしている事業者の過負荷による被害 を被る   — 事業推進部  SaaS  (WordPress)  

    —  事業推進部SaaS  (WordPress)から石狩さく らインターネットのMySQLへの接続不能発 生  (未だに原因不明)   — どちらの事例の場合も事業者乗換で回避  
  14. — 開発環境サーバ   —  旧仕様  :  Write  Back  with  BBU  

    —  新仕様  :  Always  Write  Back   — 書き込みスピードを得る代わりに、データ 保障されない仕様に変更します。   — サーバ強制終了時のデータは保障されませ んので、環境構築手順(日本語,  script,  chef   recipe  手段不問)とデータバックアップを お願いします。