R ights Reserved. Co nfid en tial 2段階処理を行い構造化データで出力 特定の情報を取得しやすい形式で出力したい場合におすすめ PDF 出力データ Text情報 図・表・グラフの個数 PDF 図・表・グラフの情報 ① ② 5ページ 3ページ メリット • 複数ページまとめて処理が可能(リクエスト数の削減) • 構造化されているため特定の情報抽出が容易 • 出力形式を調整しやすい デメリット • 2段階の処理に分かれているため、並列化が難しい • 1度に処理を行うページ数が多いと、精度はMarkdownに比 べて劣る • 表があっても認識できない • リピーティングが起きやすくなる リクエスト数とコスト 30ページのPDFの場合、 • リクエスト数:概要生成が6回、要素生成が10回 • 抽出コスト:約2.6円 • 概要生成:約0.00132$ / リクエスト • 要素生成:約0.00096$ / リクエスト ユースケース • 特定のデータに関する分析 • 特定のグラフの数値を追跡する • 複雑な文書解析