Slide 14
Slide 14 text
構築して分かったこと
14
Copyright© 2024, JAZUG All Rights Reserved.
RAG に取り込むデータの準備に想定していたよりも多くのコストがかかった
既存業務プロセスからデータ抽出
• 取り込みに足るデータか目視の個別判定が必要なケースもあった
非構造化データのフォーマット整理
個人情報の取り扱い
• 個人情報保護法
• AOAI で個人情報を取り扱うことはできるが、技術面ではなく法務的ハードルが結構高い
• 個人情報(氏名、メールアドレス、電話番号など)の抽出
• 普通の文章に個人情報が入ってくるため、ルールベースでの抽出が難しい
• Azure AI Language の PII(Personally Identifiable Information)を利用した
• マスキング
• 氏名は仮名に変更
• メールアドレスは後からユーザー識別できるような仮アドレスに変更
• 最終確認は目検(手動)