Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

CCITT Group 4

CCITT Group 4は、2値(白黒)画像専用に設計されたロスレス圧縮アルゴリズムで、PDFドキュメント内のスキャンページやファックス送信に広く使用されています。

カテゴリ: General PDF Concepts
キーワード: ccitt group 4, CCITT Group 4

概要

CCITT Group 4は、2値(白黒)画像専用に設計されたロスレス圧縮アルゴリズムで、PDFドキュメント内のスキャンページやファックス送信に広く使用されています。PDF仕様でサポートされる標準的な圧縮方式の1つです ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この圧縮方式は、冗長なエンコードパスを排除し、2次元圧縮のみを使用することで、以前のCCITT方式と比較して優れた圧縮率を実現します。

定義

CCITT Group 4(正式にはITU-T T.6)は、連続する黒または白のピクセルのランを識別して圧縮することで2値画像をエンコードするファクシミリ圧縮規格です。1次元と2次元のエンコードを交互に行うCCITT Group 3とは異なり、Group 4は純粋な2次元圧縮を使用し、前のスキャンラインを参照することでより高い圧縮率を実現します。このアルゴリズムは、絶対的なピクセル位置をエンコードするのではなく、上のスキャンラインを基準として色が変化する位置(黒から白、または白から黒への遷移)をエンコードすることで動作します。これにより、テキスト行、表、フォームなど、水平方向のパターンを持つドキュメントに対して特に効果的です。PDFドキュメントでは、CCITT Group 4はCCITTFaxDecodeフィルタによって識別され、その効率性とロスレスな特性から、2値画像コンテンツに最適な圧縮方式として推奨されています。

重要性

PDF生成や処理を行う開発者にとって、CCITT Group 4圧縮は、スキャンページ、ファックス画像、または任意の2値コンテンツを含む効率的なドキュメントを作成するために不可欠です。ドキュメント管理システムやPDFワークフローを構築する際、白黒画像にCCITT Group 4を選択することで、ファイルサイズを大幅に削減できます。典型的なテキストドキュメントでは、品質を一切損なうことなく、20:1以上の圧縮率を達成することがよくあります。これは、大量のスキャンドキュメント、アーカイブシステム、または帯域幅とストレージが問題となるドキュメント送信を扱うアプリケーションにとって特に重要です。CCITT Group 4を他の圧縮方式(グレースケール/カラー画像向けのJBIG2JPEGなど)とどのように使い分けるかを理解することで、開発者はドキュメントの忠実性を維持し、PDFリーダー間での広範な互換性を確保しながら、PDFファイルサイズを最適化できます。

仕組み

CCITT Group 4圧縮は、画像を1行ずつスキャンし、白から黒、または黒から白への各遷移の水平位置をエンコードすることで動作します。このアルゴリズムは、参照ライン(通常は前のスキャンライン)を使用し、現在のラインをそれに対して相対的にエンコードします。その際、パスモード(参照ラインが現在のラインより先に変化する場合)、垂直モード(遷移がほぼ一致する場合)、水平モード(遷移が大きく異なる場合)などのいくつかのコーディングモードを使用します。圧縮には、修正ハフマン符号化と修正READ(Relative Element Address Designate)エンコーディングを使用して、これらの関係をコンパクトに表現します。このアルゴリズムは、ドキュメント画像内の隣接するスキャンラインが高い相関性を持つことを前提としており、これはほとんどのテキストや線画コンテンツで当てはまります。Group 4はGroup 3で使用される1次元フォールバックラインを排除しているため、より優れた圧縮を実現しますが、エラーのない伝送が必要となるため、リアルタイムのファックス送信よりもPDFに保存されるドキュメントに最適です。PDFの実装では、CCITTFaxDecodeフィルタは、K=-1(純粋な2次元Group 4エンコーディングを指定)、Columns(画像幅)、Rows(画像高さ)などのパラメータで設定できます。

関連用語

  • CCITTFaxDecode – Group 3やGroup 4を含むCCITT圧縮方式を指定するために使用されるPDFフィルタ名
  • Bilevel image(2値画像) – 2色のみ(通常は白と黒)を含む画像で、CCITT圧縮に最適な画像タイプ
  • JBIG2 – CCITT Group 4よりも優れた圧縮を実現できる、より高度な2値圧縮アルゴリズムですが、複雑性は高くなります
  • Lossless compression(ロスレス圧縮) – CCITT Group 4のように、すべての元の画像データを保持し、完全な復元を可能にする圧縮方式
  • Image XObject – CCITTFaxDecodeなどの圧縮フィルタと関連する画像データを含むPDFオブジェクトタイプ

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html