20240917_wandb_Monthly_meetup_TIS

Slide 1

Slide 1 text

Slide 2

Slide 2 text

© 2024 TIS Inc. 2 概要 TISでは昨年度から「TIS AIChatLab」という社内専用AIチャットを公開・運用しています。ここではTIS AIChatLabのRAG（Retrieval-Augmented Generation）モデルの応答評価に焦点を当て、その技術的なアプローチと評価プロセス、Weights & Biasesの利用例を解説します。先だってオウンドメディアで公開した社内AIチャット「TIS AIChatLab」：RAG応答評価の仕組みとプロセスという記事をベースにしつつ、最新の状況を踏まえてお届けします。

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

© 2024 TIS Inc. 5 これまでの歩みを1ページで • 2023/07 社内専用AIチャット「TIS AIChatLab」初期バージョン公開 • GPT-3.5で一般的な内容をチャットするだけのもの • RAGは無し • React(TypeScript) + Spring Boot(Java) + Azure OpenAI Service • 2023/10 社内情報検索を行えるRAG構成へとバージョンアップ • RAGにはAzure AI Search On Your Dataを使用 • 課題：体感的に回答精度が低い、定量評価が行えていない • 2024/01 部門横断の専門チームを立ち上げ回答精度の改善に着手 • アーキテクチャの刷新 • AI Seach On Your Data → 自前のRAG(ブラックボックスをなくしてチューニングしやすく) • Spring Boot(Java) → Python(LangChain + FastAPI) • 2024/03 回答精度の改善を達成 • 継続したUX改善を実施

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

© 2024 TIS Inc. 14 コード例：トレースの取得 ※注：今後はWeaveが主流になっていくため、あまり役に立たない知見かもしれません • AsyncClientのappパラメーターへFastAPIオブジェクトを渡すことでHTTP通信をバイパスし、同一プロセスでリクエストを処理している • HTTP通信をバイパスしている理由は、アプリの作りの問題で、RAGのチェインが疎結合になっておらず、チェイン単独で呼び出すことができなかったため

Slide 15

Slide 15 text

Slide 16

Slide 16 text

© 2024 TIS Inc. 16 トレースに関して今後の展望プロダクション環境での内部状態を把握したいため、プロダクション環境でもトレースを記録したい。現状は OpenTelemetry + Application Insights で一応トレースを見ることができるが、 HTTP通信やAzure Cosmos DBとの通信など、一連のトレースが記録されているためノイズが多い。 Weaveへ移行したい。

Slide 17

Slide 17 text

© 2024 TIS Inc. 17 脇道）生成AIの確率的な性質に起因する課題評価やWeights & Biasesとは関連しない話題だが、、、みなさんがどうされているのかお聞きしたいです • UIのE2Eテストを自動化しており、Visual Regression Testingを行っているが、生成されるテキストが毎回異なるため毎回差分が検出されてしまい、正直言ってテストが機能していない、、、 • UIのテストなので生成されるテキストの内容には関心がない • そのためE2Eテストの際は FakeMessagesListChatModel を用いて生成されるテキストに再現性を持たせたいと考えている生成AIの確率的な性質とテスト自動化について、みなさんどう向き合っていますか？

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

© 2024 TIS Inc. 20 参考 Fintan（オウンドメディア）へ投稿した生成AI関連の記事 • 社内AIチャット「TIS AIChatLab」：RAG応答評価の仕組みとプロセス • 社内AIチャット「TIS AIChatLab」：RAGアーキテクチャの刷新とUX改善 • GitHub Copilotの導入状況と効果、導入に向けて実施した取り組み • 生成AIリテラシー向上研修：研修資料の公開サービス提供 • 生成AIビジネス活用研修サービス • AI搭載型チャットボット作成サービス：Dialog Play® • 生成AI導入支援サービス

Slide 21

Slide 21 text

ご清聴ありがとうございました