Knowledge Baseを作りembeddingする①
• Knowledge base -> Create Knowledge base
‣ Knowledge base name:適当
‣ IAM Permission:Create and use a new service role
‣ Choose data source:S3
Slide 28
Slide 28 text
Knowledge Baseを作りembeddingする②
• Data source設定
‣ Data source name:適当
‣ S3 URI:さっき作ったバケットを指定
‣ Chanking and parsing configurations
‣ デフォルトだと300トークン単位で分割される
‣ 変な箇所で区切られたりすると検索精度に影響する
‣ Contextとしておかしくない単位でチャンク分割が理想
‣ 今回は何も考えずdefault(300トークン)で
Slide 29
Slide 29 text
Knowledge Baseを作りembeddingする③
• Embeddings model
‣ Titan Embeddings G1 – Text v1.2 を選択
‣ 新型 Titan Embeddings Text 2 ってのもある(東京regionまだ)