PDFからクリッピングされていない画像を抽出する
JPedalは、PDFドキュメントから画像を簡単に抽出するための複数のメソッドを提供しています。この例では、ページ上でクリッピング、回転、スケーリングされる前の、ページで使用されている生の画像を取得します。ページ上に表示されている状態の画像を取得したい場合は、ExtractClippedImages を使用できます。
java -jar jpedal.jar --extractImages "inputFileOrFolder" "outputFolder" "outputImageFormat"
このコマンドは、“inputFileOrFolder"で指定されたPDFまたはPDFのディレクトリから、存在するすべての画像を抽出します。出力は"outputFolder"で指定されたディレクトリに配置されます。出力フォーマットは"outputImageFormat"を使用して指定します。
静的な簡易メソッド
ExtractImages.writeAllImagesToDir(
"inputFileOrFolder",
"outputFolder",
"outputImageFormat",
true,
false);
APIアクセスメソッド
ExtractImages extract = new ExtractImages("inputFile.pdf");
//extract.setPassword("password");
if (extract.openPDFFile()) {
int pageCount = extract.getPageCount();
for (int page = 1; page <= pageCount; page++) {
int imagesOnPageCount = extract.getImageCount(page);
for (int image = 0; image < imagesOnPageCount; image++) {
BufferedImage image = extract.getImage(page, image, true);
}
}
}
extract.closePDFfile();
この例では、JPedalのExtractImages クラスを使用しています。ExtractImagesは、BMP、PNG、JPG、JPG2000、TIFFを含む複数の異なる画像フォーマットで画像を出力できます。
