Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

JPEG

JPEG(Joint Photographic Experts Group)は、写真画像に広く使用される非可逆圧縮フォーマットであり、PDFドキュメントに直接埋め込むことができます。

カテゴリ: General PDF Concepts
キーワード: jpeg, JPEG

概要

JPEG(Joint Photographic Experts Group)は、写真画像に広く使用される非可逆圧縮フォーマットであり、PDFドキュメントに直接埋め込むことができます。PDFでは、JPEG圧縮された画像データは通常DCTDecodeフィルタを通じて処理されます。これにより、PDFは標準的なJPEGフォーマットとの互換性を維持しながら、写真コンテンツを効率的に保存できます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。そのため、JPEGは、特に写真や複雑なカラー画像を含むドキュメントにおいて、PDFファイル内で最も一般的な画像フォーマットの一つとなっています。

定義

JPEGは、離散コサイン変換(DCT)アルゴリズムを使用してファイルサイズを削減する標準化された画像圧縮方式です。人間の目に知覚されにくい画像データを選択的に破棄することで圧縮を実現します。PDFドキュメント内では、JPEG画像はストリーム辞書にDCTDecodeフィルタが指定されたImage XObjectとして表現されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )PNGやLZW圧縮を使用したTIFFなどの可逆フォーマットとは異なり、JPEG圧縮はファイルサイズを小さくするために一部の画像データを永久的に削除するため、「非可逆」と呼ばれます。PDF仕様では、JPEGデータを再エンコードせずに直接保存できるため、JPEGファイルは元の圧縮形式を保持したままPDFに埋め込むことができます。これは、BMPや非圧縮TIFFなどのフォーマットとは異なります。これらのフォーマットは埋め込み時にPDF圧縮フィルタを使用してエンコードする必要があります。

重要性

PDFを扱う開発者にとって、JPEGの実装を理解することは、いくつかの理由から極めて重要です。第一に、JPEG圧縮は、ドキュメントに写真コンテンツが含まれる場合にPDFファイルサイズを大幅に削減します。これは、Web配信やストレージの最適化に不可欠です。第二に、PDFがJPEGデータをネイティブに保存できることを理解することで、開発者は品質を劣化させる不要な再圧縮を避けて、画像を効率的に埋め込むことができます。第三に、PDFから画像をプログラム的に抽出する際、DCTDecodeストリームを認識することで、開発者はデコードと再エンコードを行わずに元のJPEGデータを直接抽出でき、品質と処理時間の両方を保持できます。最後に、アクセシビリティに準拠したPDFの場合、開発者はPDF/UA ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準で求められるように、JPEG画像に適切な代替テキストを含め、ドキュメント構造内で適切にタグ付けする必要があります。

仕組み

PDFドキュメントでは、JPEG画像はプロパティを定義する特定の辞書エントリを持つストリームオブジェクトとして保存されます。ストリーム辞書には、ストリームデータがJPEG圧縮を使用していることを示す/Filterエントリが/DCTDecodeに設定されています ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。画像ストリームには、色空間情報(/DeviceRGB/DeviceCMYKなど)、/Width/Heightエントリによる寸法、/BitsPerComponentによる色成分あたりのビット数も指定されます。PDFレンダラーがDCTDecodeストリームを検出すると、JPEGデコーダーを使用して表示用に画像データを展開します。DCT(離散コサイン変換)アルゴリズムは、空間画像データを周波数領域データに変換し、人間の視覚認識に基づいてこれらの周波数成分を量子化します。目立ちにくい高周波数の詳細は、より積極的に圧縮されます。開発者は、外部JPEGファイルを参照するか、圧縮されたJPEGバイトストリームをPDF構造に直接埋め込むライブラリを使用して、JPEG画像をPDFに埋め込むことができます。PDF仕様は、JPXDecodeフィルタを通じてJPEG 2000もサポートしており、異なる特性を持つ代替圧縮方式を提供しています。

関連用語

  • DCTDecode – 離散コサイン変換を使用したJPEG圧縮のPDFフィルタ名
  • Image XObject – ドキュメントに埋め込まれた外部画像を表現するために使用されるPDFオブジェクトタイプ
  • 非可逆圧縮 – 一部の情報を永久的に削除してファイルサイズを削減するデータ圧縮
  • ストリームオブジェクト – 辞書と関連するバイナリデータで構成されるPDFオブジェクト
  • 色空間 – RGBやCMYKなど、PDF画像内で色を表現するために使用される方法

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html