Slide 7
Slide 7 text
🄫2024 segavvy 2024/12/19 ChatGPT Meetup Tokyo #9 7
サービスの仕組み(準備)
お客様の管理者 弊社サービス Watson Discovery AOAI ChatGPT 対象Webサイト
①対象Webページ・ファイルの内容を取得
②取得内容の整形、除外、分割、除去、etc.
③登録
クロール
必要に応じた調整
①同義語登録、ランカー学習、アノテーション付与、etc.
①Webスクレイピングです。
対象サイトのリンクを芋づる
的にたどったりサイトマップ
を利⽤したりすることで対象
サイトのページ・ファイルの
内容を取得します。
②グロナビの除去、⽬
次のようなページの除
外、PDFのページ分割、
タイトル中の定型⽂⾔
除去、内容の重複除去
などにより整形します。
③Watson Discoveryへ
登録します。Discovery
はRAGにおける外部情
報DBの位置付けです。
調整機能はDiscoveryの機能と独⾃機能の組み合わ
せです。お客様の管理者は、必要に応じて同義語
登録、セマンティックランカーの学習、アノテー
ション付与などによるチューニングができます。