構造化テキストをePUBとして抽出する
v2025.04
構造化テキスト(マークされたコンテンツやタグ付きPDFとも呼ばれる)を含むPDFファイルは、JPedalで処理してePUBファイル形式に変換できます。
タグ付きPDFをePUBに変換するには
final String password = null; //null is used when no password required
final ErrorTracker tracker = null; //ErrorTracker implementations can be used to monitor extraction
final ExtractStructuredTextProperties properties = new ExtractStructuredTextProperties();
properties.setFileOutputMode(OutputModes.EPUB);
properties.setEpubTitle("My EPUB");
ExtractStructuredText.
writeAllStructuredTextOutlinesToDir("inputFileOrFolder", password, "outputFolder", tracker, properties);
ExtractStructuredText.
writeAllStructuredTextOutlinesAndFiguresToDir("inputFileOrFolder", password, "outputFolder", tracker, properties, "figuresFolder", "imageFormatJpegOrPngOnly");
ePUB 3.0のみがサポートされているバージョンです
JPEGとPNGのみがePUBでサポートされている画像ファイル形式です
