Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

構造化テキストをePUBとして抽出する

v2025.04

構造化テキスト(マークされたコンテンツやタグ付きPDFとも呼ばれる)を含むPDFファイルは、JPedalで処理してePUBファイル形式に変換できます。

タグ付きPDFをePUBに変換するには

final String password = null; //null is used when no password required
final ErrorTracker tracker = null; //ErrorTracker implementations can be used to monitor extraction
final ExtractStructuredTextProperties properties = new ExtractStructuredTextProperties();
properties.setFileOutputMode(OutputModes.EPUB);
properties.setEpubTitle("My EPUB");

ExtractStructuredText.
        writeAllStructuredTextOutlinesToDir("inputFileOrFolder", password, "outputFolder", tracker, properties);

ExtractStructuredText.
        writeAllStructuredTextOutlinesAndFiguresToDir("inputFileOrFolder", password, "outputFolder", tracker, properties, "figuresFolder", "imageFormatJpegOrPngOnly");

ePUB 3.0のみがサポートされているバージョンです

JPEGとPNGのみがePUBでサポートされている画像ファイル形式です