構造化テキストをePUBとして抽出する
v2025.04
構造化テキスト(マークされたコンテンツまたはタグ付きPDFとも呼ばれます)を含むPDFファイルは、JPedalで処理してePUBファイル形式に変換できます。
タグ付きPDFをePUBに変換するには
final String password = null; //null is used when no password required
final ErrorTracker tracker = null; //ErrorTracker implementations can be used to monitor extraction
final ExtractStructuredTextProperties properties = new ExtractStructuredTextProperties();
properties.setFileOutputMode(OutputModes.EPUB);
properties.setEpubTitle("My EPUB");
ExtractStructuredText.
writeAllStructuredTextOutlinesToDir("inputFileOrFolder", password, "outputFolder", tracker, properties);
ExtractStructuredText.
writeAllStructuredTextOutlinesAndFiguresToDir("inputFileOrFolder", password, "outputFolder", tracker, properties, "figuresFolder", "imageFormatJpegOrPngOnly");
サポートされているバージョンはePUB 3.0のみです
ePUBでサポートされている画像ファイル形式はJPEGとPNGのみです
