BuildVuはテーブル構造を保持しますか?
BuildVuは元のPDFファイルに表示されているテーブルの視覚的な外観を保持しますが、テーブル構造を生成することはありません。
大部分のPDFファイルには、実際には構造化されたコンテンツが含まれていません。つまり、見出し、段落、テーブルなどのドキュメント構造に関する情報が提供されていないということです。
PDFファイルに構造化されたコンテンツが含まれている場合は、JPedal を試してみることをお勧めします。構造化されたコンテンツが存在する場合、JPedalはXMLまたはHTML として抽出することができます。
