#6
1.表抽出・解析の仕組み
1.1で利用した技術はこちら -> Google Cloud公式 Image understanding: https://ai.google.dev/gemini-api/docs/image-understanding
1-1. Image Segmentation
1-2. 表画像抽出
1-3. 構造化データ変換
{
“part_name”: “CASE, SIDE A”,
“drawing_number”: “99999-0006A”,
“material”: “ADC12”,
“product_weight”: 0.0313,
“date”: “2024-09-29”,
“etc”: “....”,
}
解像度を元に戻し表画像を抽出
LLMが表を読み取り、構造化データに変換
図中の表を解釈し、重要項目を構造化データとして読み解く
概観が分かる低解像度の図面を用意
Geminiで図面中の表を識別 (赤い枠線)