Upgrade to Pro — share decks privately, control downloads, hide ads and more …

インシデントに対するQAの向き合い方

 インシデントに対するQAの向き合い方

Ryoko Takagi

August 01, 2024
Tweet

Other Decks in Technology

Transcript

  1. © 2023 Reiwa Travel, Inc.
 2
 Background 2018年4⽉:株式会社SHIFTに新卒⼊社 • 広告配信システムや決済系アプリなどのQA

    業務を担当 • チームリーダーとしてメンバーのマネジメ ントや育成業務なども⾏う 2022年9⽉:令和トラベルに⼊社 • NEWT app/webのQA業務を幅広く担当 Like • ディズニー • 脱出ゲーム • 旅⾏ QA Engineer ⾼⽊ 涼⼦
  2. © 2023 Reiwa Travel, Inc.
 インシデントとは 5
 ツアーが 検索できない 予約したホテルに

    泊まれない 基幹システムが 開けない 誰かしらに影響がある障害 →予約前のカスタマー →旅⾏中のカスタマー →社内メンバー
  3. © 2023 Reiwa Travel, Inc.
 インシデントとは 6
 インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  4. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 16
 カスタマー⽬線での リリース時本番確認 push通知/メールは

    全て開いて確認 インシデント検知のためにやっていること QAフロー内 QAフロー外
  5. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 17
 テスト環境でのQAと違って、全て のパターンを本番確認することは 不可能

    →カスタマーが最も通りやすいパ ターンで、カスタマーの気持ちに なって操作 カスタマー⽬線でのリリース時本番確認
  6. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 18
 push通知/メールは⾃動送信して いるものも多く、全てを事前にQA することはできない

    →⾃分に届いたものは全て開いて 確認し、少しでも気になることが あればエスカレ push通知/メールは全て開いて確認
  7. © 2023 Reiwa Travel, Inc.
 そもそも⾃分で最速で⾒つける 19
 カスタマー⽬線での リリース時本番確認 push通知/メールは

    全て開いて確認 チームで形式知化するために 全社的な意識づけ 🦋ラベルの運用 QAフロー内 QAフロー外
  8. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 24
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  9. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 25
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応
  10. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 26
 (再掲)インシデント対応フロー 1. 気づいた⼈がインシデントチャンネルに第⼀報を投下

    2. コントローラーを⽴てて、不具合内容/影響度からレベル判断 a. レベルとは:L0/L1/L2/L3で定義、L0が⼀番深刻な障害(サーバー全停⽌など) 3. レベルごとのフローに従って対応 a. L0/L1:即時の原因究明&暫定対応が求められる b. L2/L3:ベストエフォートで対応 →PM/エンジニア/QAがそれぞれ協⼒しあって対応 カスタマーからの問い合わせ →トラベルサポートチームが対応
  11. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 28
 トラベルサポートチームは、カスタマーサポートのプロであって プロダクトのプロではない トラベルサポートチーム

    どこまでの調査でエンジニアに質問 してよいのかわからない →第⼀報を上げるのが遅れる&上げ ても不安な状態で待つことになる プロダクトチーム 直接カスタマーとコミュニケーショ ンを取れない →第⼀報が上がってきても、カスタ マーの状況が詳細に掴み取れないこ とがある
  12. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 29
 トラベルサポートチームは、カスタマーサポートのプロであって プロダクトのプロではない トラベルサポートチーム

    どこまでの調査でエンジニアに質問 してよいのかわからない →第⼀報を上げるのが遅れる&上げ ても不安な状態で待つことになる プロダクトチーム 直接カスタマーとコミュニケーショ ンを取れない →第⼀報が上がってきても、カスタ マーの状況が詳細に掴み取れないこ とがある QAエンジニアだからこそ できることは…?
  13. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 30
 とにかく早く レスポンスする 調査しやすいように

    ⾔語化する 回避策を⾒つけて 共有する わたしが意識していること 心理的安全性 メンバーの橋渡し カスタマー目線
  14. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 31
 第⼀報を投げても誰かから返信が 返ってくるまでとても不安 →とにかく、⾒てるよ、今再現確

    認してるよ、とアピール ※これを意識したことで、普段から少し気軽 に質問してもらえるようになりました とにかく早くレスポンスする
  15. © 2023 Reiwa Travel, Inc.
 各チームの橋渡し役になる 32
 例:トラベルリンクできない • できないってどの画⾯で?

    • エラーが出る?ボタンが押せない? • iOS/Android 再現verは? →再現確認を通して、障害をエンジニア がより調査しやすいように⾔語化 調査しやすいように⾔語化する 旅行者から同行者に 旅程をかんたんに シェアできる機能