Upgrade to Pro — share decks privately, control downloads, hide ads and more …

インシデントに対するQAの向き合い方

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 インシデントに対するQAの向き合い方

Avatar for Ryoko Takagi

Ryoko Takagi

August 01, 2024
Tweet

Other Decks in Technology

Transcript

  1. © 2023 Reiwa Travel, Inc.
 2
 Background 2018年4⽉:株式会社SHIFTに新卒⼊社 • 広告配信システムや決済系アプリなどのQA

    業務を担当 • チームリーダーとしてメンバーのマネジメ ントや育成業務なども⾏う 2022年9⽉:令和トラベルに⼊社 • NEWT app/webのQA業務を幅広く担当 Like • ディズニー • 脱出ゲーム • 旅⾏ QA Engineer ⾼⽊ 涼⼦
  2. © 2023 Reiwa Travel, Inc.
 インシデントとは 5
 ツアーが 検索できない 予約したホテルに

    泊まれない 基幹システムが 開けない 誰かしらに影響がある障害 →予約前のカスタマー →旅⾏中のカスタマー →社内メンバー
  3. © 2023 Reiwa Travel, Inc.
 インシデントとは 6
 インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  4. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 16
 カスタマー⽬線での リリース時本番確認 push通知/メールは

    全て開いて確認 インシデント検知のためにやっていること QAフロー内 QAフロー外
  5. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 17
 テスト環境でのQAと違って、全て のパターンを本番確認することは 不可能

    →カスタマーが最も通りやすいパ ターンで、カスタマーの気持ちに なって操作 カスタマー⽬線でのリリース時本番確認
  6. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 18
 push通知/メールは⾃動送信して いるものも多く、全てを事前にQA することはできない

    →⾃分に届いたものは全て開いて 確認し、少しでも気になることが あればエスカレ push通知/メールは全て開いて確認
  7. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 19
 カスタマー⽬線での リリース時本番確認 push通知/メールは

    全て開いて確認 チームで形式知化するために 全社的な意識づけ 🦋ラベルの運用 QAフロー内 QAフロー外
  8. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 24
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  9. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 25
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  10. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 26
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応 カスタマーからの問い合わせ →トラベルサポートチームが対応
  11. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 28
 トラベルサポートチームは、カスタマーサポートのプロであって プロダクトのプロではない トラベルサポートチーム

    どこまでの調査でエンジニアに質問 してよいのかわからない →第⼀報を上げるのが遅れる&上げ ても不安な状態で待つことになる プロダクトチーム 直接カスタマーとコミュニケーショ ンを取れない →第⼀報が上がってきても、カスタ マーの状況が詳細に掴み取れないこ とがある
  12. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 29
 トラベルサポートチームは、カスタマーサポートのプロであって プロダクトのプロではない トラベルサポートチーム

    どこまでの調査でエンジニアに質問 してよいのかわからない →第⼀報を上げるのが遅れる&上げ ても不安な状態で待つことになる プロダクトチーム 直接カスタマーとコミュニケーショ ンを取れない →第⼀報が上がってきても、カスタ マーの状況が詳細に掴み取れないこ とがある QAエンジニアだからこそ できることは…?
  13. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 30
 とにかく早く レスポンスする 調査しやすいように

    ⾔語化する 回避策を⾒つけて 共有する わたしが意識していること 心理的安全性 メンバーの橋渡し カスタマー目線
  14. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 31
 第⼀報を投げても誰かから返信が 返ってくるまでとても不安 →とにかく、⾒てるよ、今再現確

    認してるよ、とアピール ※これを意識したことで、普段から少し気軽 に質問してもらえるようになりました とにかく早くレスポンスする
  15. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 32
 例:トラベルリンクできない • できないってどの画⾯で?

    • エラーが出る?ボタンが押せない? • iOS/Android 再現verは? →再現確認を通して、障害をエンジニア がより調査しやすいように⾔語化 調査しやすいように⾔語化する 旅行者から同行者に 旅程をかんたんに シェアできる機能