Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDJpeg

PDJpegは、Apache PDFBoxライブラリに含まれるJavaクラスで、PDF文書内に埋め込まれたJPEG画像データを表現します。

キーワード: pdjpeg, PDJpeg

概要

PDJpegは、Apache PDFBoxライブラリに含まれるJavaクラスで、PDF文書内に埋め込まれたJPEG画像データを表現します。これは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているDCTDecodeフィルタ仕様に準拠したJPEG画像ストリームを処理するための特殊な実装として機能します。このクラスにより、開発者はPDFファイル構造内にXObjectとして保存されているJPEG画像を抽出、操作、処理することができます。

定義

PDJpegは、Apache PDFBoxの画像処理フレームワーク内の具象クラスで、PDF文書内のJPEG圧縮画像データを専門的に扱います。汎用的な画像クラスとは異なり、PDJpegはJPEGが使用するDCT(離散コサイン変換)圧縮方式に最適化されています。これは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、PDFファイルで最も一般的に使用される画像圧縮形式の1つです。このクラスはPDFBoxのPDImageXObject階層を継承し、基礎となるJPEGデータストリームへのアクセス、幅、高さ、色空間、コンポーネントあたりのビット数などの画像プロパティのデコード、さらなる処理のための標準的なJava BufferedImageオブジェクトへの変換などのメソッドを提供します。PDJpegは、PDFBox内の他の画像クラス(PDImageXObjectStreamやPDInlineImageなど)とは異なり、JPEG色空間や圧縮パラメータの適切な処理を含む、JPEGエンコード画像の特性とメタデータを処理するために特化されています。

重要性

PDF文書を扱う開発者にとって、PDJpegは効率的な画像抽出および操作ワークフローにおいて極めて重要です。JPEG画像は、特に写真、スキャンされたコンテンツ、または複雑なグラフィックスを含む文書において、PDFファイルに埋め込まれたグラフィックスの大部分を占めています。PDJpegの使用方法を理解することで、開発者は次のことが可能になります:不必要な再圧縮や品質劣化なしに高品質な画像を抽出すること、形式変換時に適切な色の忠実性を維持すること、JPEG圧縮設定を適切に処理することでPDFファイルサイズを最適化すること、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で指定されているように画像が多用された文書を処理する際のアクセシビリティ準拠を確保すること。このクラスは、PDFコンテンツ抽出、文書変換、画像アーカイブシステム、および画像品質とメタデータの整合性を維持することが不可欠な自動文書処理パイプラインなどのシナリオにおいて特に価値があります。

仕組み

PDJpegは、PDFのコンテンツ構造内に保存されたJPEG圧縮データストリームをラップすることで動作します。PDFパーサーがDCTDecodeフィルタ( ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているJPEG圧縮を表すPDF仕様の用語)を持つ画像XObjectに遭遇すると、PDFBoxはその画像データを管理するためにPDJpegオブジェクトをインスタンス化します。このクラスは生のJPEGバイトストリームへのアクセスを提供し、開発者は圧縮されたJPEGデータを解凍せずに直接抽出する(帯域幅と処理時間の節約に有用)か、ラスタ画像形式にデコードするかを選択できます。PDJpegは、PDF色空間仕様とJavaのカラーモデルシステム間の変換を処理し、DeviceRGBDeviceCMYKDeviceGray、およびICCベースの色空間の変換を管理します。このクラスはまた、PDF画像辞書で指定される可能性のある解像度、寸法、デコード配列などのJPEG固有のメタデータを解釈します。画像をレンダリングまたは抽出する際、PDJpegはPDFBoxのリソース管理システムと連携して、色空間リソース、デコードパラメータ、およびPDF構造で指定された追加のフィルタや変換を適切に処理します。

関連用語

  • Apache PDFBox – PDF文書を扱うためのオープンソースJavaライブラリで、包括的なPDF作成および操作機能を提供
  • DCTDecode – 離散コサイン変換エンコーディングを使用したJPEG圧縮を表すPDFフィルタタイプ
  • PDImageXObject – PDFBox内でimage XObjectを表現する親クラスで、PDF文書内で再利用可能な画像リソースを表す
  • XObject – PDF文書内で複数回参照およびレンダリング可能な外部グラフィカルコンテンツを定義するPDFオブジェクトタイプ
  • Color Space – ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で指定されている、PDF画像とグラフィックスにおける色情報の表現と解釈方法を定義するシステム

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html