Slide 1

Slide 1 text

いかにして IVRyのエンジニアは 
 電話の未来を創造しているか 
 IVRy 町田


Slide 2

Slide 2 text

confidencial ⾃⼰紹介 ■ 学⽣時代: 京都⼤学・⼤学院  ⾃然⾔語処理を学ぶ ■ 2015年: 株式会社リクルートホールディングス  アプリ・Webのディレクター、データ分析等 ■ 2019年: エクサウィザーズ  NLPエンジニア、チームリード、エンジニアリングマネージャー ■ 2022年: IVRy  Point: 休⽇はボルダリングしかしていません 町⽥ 雄⼀郎 VP of AIE

Slide 3

Slide 3 text

対話型電話AI SaaS IVRy 対話型電話AI SaaS IVRy(アイブリー)は、 ⽉額3,000円からカスタム電話をカンタンに作成できるサービス。 全ての電話業務を誰でもすぐにAIを使って効率化できます

Slide 4

Slide 4 text

confidential 累計5000万着電に⾃動応答しています

Slide 5

Slide 5 text

confidential IVRyのMission 最⾼の技術を、すべての⼈と企業に届ける →どのような仕組みで実現しているか?

Slide 6

Slide 6 text

confidential Mission実現のための開発体制 - Project制の採⽤ - ユーザーインタビューへの積極的な参加 - Slackでのオープンなコミュニケーション - Whyからの関与 - Feature Flag - Coding Agentによる開発⽣産性の向上 - 信頼できる対話体験の確⽴

Slide 7

Slide 7 text

confidential Project制の採⽤ - 3ヶ⽉に1回 Projectが⾒直される - Projectのフェーズに応じた⽬的‧⼈員構成 - フェーズに応じた⾼速な仮説検証 技術検証 PJ PoC PJ PMF PJ

Slide 8

Slide 8 text

confidential Mission実現のための開発体制 - Project制の採⽤ - ユーザーインタビューへの積極的な参加 - Slackでのオープンなコミュニケーション - Whyからの関与 - Feature Flag - Coding Agentによる開発⽣産性の向上 - 信頼できる対話体験の確⽴ 少しだけ技術的な話

Slide 9

Slide 9 text

confidential 信頼できる対話体験のために: 対話の評価技術 ユーザー体験の向上のためには⾼速な仮説検証が必要 ↓ 「本当によくなったのか?」を⽰す指標が必要 → IVRyでは様々な客観指標で⾃動評価している

Slide 10

Slide 10 text

confidential 対話の評価技術: オフライン評価 IVRyのAIはworkflow的に複数のモジュールからできている。 それらのモジュールについては評価データによって外部評価を常に実⾏している。 なんとなく良くなったではなく客観的に評価することが⼤事

Slide 11

Slide 11 text

confidential 対話の評価技術: オフライン評価 例: 以前のモデルではFew-Shotデータを与えることで性能を向上させることができていたが 最新のモデルではむしろ悪影響となるケースがある

Slide 12

Slide 12 text

confidential 対話の評価技術: 完了率評価 実際の対話がうまくいったかどうかは、例えば最後のタスクが成功したかどうか(Task Completed Ratio)で⽐較することもできるが、対話全体をLLMに評価させることもで きる(LLM as a judge) 様々なユースケースでの完了率のモニタリング figure

Slide 13

Slide 13 text

confidential 対話の評価技術: End2Endの対話テスト 電話アプリケーションQAではWebとは異なり、実際に電話しなければならない。 IVRyではテスト⽤のペルソナを与えたLLMに実際に電話をかけさせ、完全 End-to-Endの対話QAシステムを作成中している。 XXXです 080... お名前は? 電話番号は?

Slide 14

Slide 14 text

confidential