PDFからクリッピングされていない画像を抽出する

JPedalは、PDFドキュメントから画像を簡単に抽出するための複数のメソッドを提供しています。この例では、ページ上でクリッピング、回転、スケーリングされる前の、ページで使用されている生の画像を取得します。ページ上に表示されている状態の画像を取得したい場合は、ExtractClippedImages を使用できます。

コマンドラインまたは他の言語でPDFからクリッピングされていない画像を抽出する

java -jar jpedal.jar --extractImages "inputFileOrFolder" "outputFolder" "outputImageFormat"

このコマンドは、“inputFileOrFolder"で指定されたPDFまたはPDFのディレクトリから、存在するすべての画像を抽出します。出力は"outputFolder"で指定されたディレクトリに配置されます。出力フォーマットは"outputImageFormat"を使用して指定します。

JavaでPDFからクリッピングされていない画像を抽出する

静的な簡易メソッド

ExtractImages.writeAllImagesToDir(
        "inputFileOrFolder",
        "outputFolder",
        "outputImageFormat",
        true,
        false);

APIアクセスメソッド

ExtractImages extract = new ExtractImages("inputFile.pdf");
//extract.setPassword("password");
if (extract.openPDFFile()) {
    int pageCount = extract.getPageCount();
    for (int page = 1; page <= pageCount; page++) {

        int imagesOnPageCount = extract.getImageCount(page);
        for (int image = 0; image < imagesOnPageCount; image++) {
            BufferedImage image = extract.getImage(page, image, true);
        }
    }
}
extract.closePDFfile();

この例では、JPedalのExtractImages クラスを使用しています。ExtractImagesは、BMP、PNG、JPG、JPG2000、TIFFを含む複数の異なる画像フォーマットで画像を出力できます。