Slide 35
Slide 35 text
ローダー・パーサーのバリエーション
DocumentLoader: Amazon S3, Azure Blob Storage,
Google Cloud Storage, File System, URL,etc...
DocumentParser: Text, Apache Tika (MSOffice(POI)
/ PDF(PDFBox))
Tikaがサポートするフォーマット
https://tika.apache.org/3.0.0-BETA2/formats.html
構造はシンプルなので独自実装も十分可能
35