Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

JBIG2Decode

JBIG2Decodeは、PDFドキュメントにおいて2値(白黒)画像、特にスキャンされたテキストページやドキュメントを効率的にエンコードするために使用される圧縮フィルターです。

カテゴリ: General PDF Concepts
キーワード: jbig2decode, JBIG2Decode

概要

JBIG2Decodeは、PDFドキュメントにおいて2値(白黒)画像、特にスキャンされたテキストページやドキュメントを効率的にエンコードするために使用される圧縮フィルターです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、このフィルターはJBIG2圧縮標準を適用し、画像品質を維持しながら従来の方法よりも大幅に高い圧縮率を実現します。JBIG2Decodeは、スキャンされたドキュメントを含むPDFファイルにおいて特に価値があり、他の圧縮方法と比較してファイルサイズを3倍から10倍削減できます。

定義

JBIG2Decodeは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているストリームフィルターで、PDFファイル内の2値画像に対してJBIG2(Joint Bi-level Image Experts Group 2)圧縮標準を実装します。FlateDecodeなどの汎用圧縮フィルターとは異なり、JBIG2Decodeは2色のみを含む画像(通常は白と黒)に特化して最適化されており、スキャンされたドキュメント、テキストページ、線画、その他の2値コンテンツに最適です。

このフィルターは、パターンマッチングとシンボル置換技術を採用することで、CCITT Group 4CCITTFaxDecode)のような以前の2値圧縮方法とは異なります。JBIG2Decodeは、同じ文字がページ上に複数回出現するような繰り返しの形状を検出すると、その形状を一度だけ保存し、ドキュメント全体で参照することで、大幅にファイルサイズを削減できます。圧縮は非可逆または可逆のいずれかで実行でき、非可逆圧縮では視覚的に類似したシンボルを同一として扱うことで、さらに大きなサイズ削減を実現します。

重要性

PDFドキュメントを扱う開発者にとって、スキャンされたドキュメントの処理やドキュメント画像を扱うアプリケーションの作成において、JBIG2Decodeの理解は極めて重要です。このフィルターの優れた圧縮効率は、ストレージコスト、ネットワーク帯域幅の使用量、ドキュメントの読み込み時間に直接影響します。これらは、ドキュメント管理システム、デジタルアーカイブ、WebベースのPDFビューアにとって重要な要素です。

PDF生成ツールやドキュメントスキャンワークフローを構築する開発者は、ファイルサイズを最適化するために、2値コンテンツに対してJBIG2Decodeの使用を検討すべきです。ただし、JBIG2圧縮には専用のエンコーディングライブラリが必要であり、ライセンスに関する考慮事項がある可能性があることに注意が必要です。また、アクセシブルなPDFを扱う際には、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などのドキュメントで概説されているアクセシビリティ標準を満たすため、JBIG2圧縮された画像が適切にタグ付けされ、代替テキスト説明が含まれていることを開発者は確認する必要があります。

仕組み

JBIG2Decodeは、2値画像データを分析し、高度な圧縮技術を適用することで動作します。エンコーディングプロセスは、画像内の連結成分(個別の形状)を識別し、類似した形状をシンボルクラスにグループ化します。ドキュメント内で同じ文字、数字、またはシンボルが複数回出現する場合、JBIG2は単一のテンプレートを保存し、以降の出現には位置参照を使用します。

JBIG2の圧縮プロセスには、3つの主なエンコーディング方法が含まれます:任意の2値領域に対する汎用領域エンコーディング、繰り返しパターンに対するシンボル辞書エンコーディング、ディザリングされた画像に対するハーフトーン領域エンコーディングです。エンコーダーは非可逆モードまたは可逆モードで動作できます。非可逆圧縮は、視覚的に類似したシンボルを単一のテンプレートで置き換えることでより高い圧縮率を実現し、可逆モードはピクセルレベルで正確な精度を保持します。

( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているPDFファイル構造において、JBIG2圧縮されたデータは、辞書に/Filter /JBIG2Decodeを持つストリームオブジェクトとして表示されます。このフィルターは、複数の画像ストリームが参照できる共有シンボル辞書を含む別個のJBIG2グローバルストリームを参照することもあり、複数ページのドキュメント全体で冗長性をさらに削減します。デコーダーは、元の2値画像を正しく再構築するために、埋め込まれたJBIG2データと参照されているグローバルストリームの両方をサポートする必要があります。

関連用語

  • FlateDecode – deflateアルゴリズムに基づく汎用圧縮フィルターで、さまざまなPDFストリームタイプに使用されます
  • CCITTFaxDecode – Group 3またはGroup 4 FAX圧縮標準に基づく2値画像用の初期の圧縮フィルター
  • Image XObject – 外部画像を表すPDFオブジェクトタイプで、JBIG2Decodeを含むさまざまなフィルターを使用できます
  • Stream Filter – PDFファイル内のストリームデータを圧縮、エンコード、または変換するために適用される処理方法
  • DCTDecodeJPEG圧縮に基づくカラーおよびグレースケール画像用の圧縮フィルターで、JBIG2の2値特化とは対照的です

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html