Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

CCITTFactory

CCITTFactoryは、Apache PDFBoxライブラリのユーティリティクラスで、CCITT(国際電信電話諮問委員会)画像圧縮を処理します。

キーワード: ccittfactory, CCITTFactory

概要

CCITTFactoryは、Apache PDFBoxライブラリのユーティリティクラスで、CCITT(国際電信電話諮問委員会)画像圧縮を処理します。これは、スキャン文書やFAX送信においてPDF文書で一般的に使用される二値画像エンコード方式です。この圧縮形式は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、PDFファイルに埋め込まれた白黒画像を扱う際に特に関連性があります。このクラスは、CCITT Group 3およびGroup 4圧縮方式を使用して画像を作成、エンコード、デコードするためのメソッドを提供します。

定義

CCITTFactoryは、Apache PDFBox内の専門的なJavaクラスで、CCITT FAX圧縮アルゴリズムのサポートを実装しています。汎用的な画像ハンドラとは異なり、CCITTFactoryはCCITT圧縮標準を使用した二値(1ビット白黒)画像を専門的に扱います。このクラスは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、生の画像データとPDF文書内で使用される圧縮CCITT形式との橋渡しの役割を果たします。他の画像関連PDFBoxクラスとは異なり、カラーやグレースケール画像ではなく、モノクロ画像圧縮に特化している点が特徴です。設計におけるファクトリパターンにより、開発者はCCITT圧縮データからPDImageXObjectインスタンスを作成したり、既存の画像をこの効率的な形式に変換したりできます。

重要性

文書管理システムを扱う開発者にとって、CCITTFactoryはPDF内のスキャン文書やFAXベースのコンテンツを効率的に処理するために不可欠です。CCITT圧縮は、白黒文書に対して標準形式よりも大幅に優れた圧縮率を実現し、非圧縮二値画像と比較してファイルサイズを10〜50分の1に削減します。これは、スキャンされたテキストコンテンツを含むアクセシブルなPDF文書 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) を構築する際に特に重要になります。適切な画像処理はファイルサイズと文書の使いやすさの両方に影響するためです。CCITTFactoryを理解することで、開発者はPDF生成パイプラインを最適化できます。特に、フォーム、請求書、契約書など、スキャン画像から生成されるビジネス文書を扱うアプリケーションにおいて効果的です。

仕組み

CCITTFactoryは、PDF標準 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているCCITT T.4(Group 3)およびT.6(Group 4)圧縮アルゴリズムを実装することで動作します。エンコード時、クラスはBufferedImageまたは生の画像データを受け取り、連続する黒または白のピクセルを効率的に表現するランレングスエンコーディング技術を適用します。ファクトリメソッドは、画像の寸法、コンポーネントあたりのビット数、圧縮タイプ、圧縮データの解釈方法を制御するデコードパラメータなどのパラメータを受け入れます。デコード操作では、CCITTFactoryはPDFの画像リソースから圧縮ビットストリームを読み取り、圧縮プロセスを逆転させることで元の二値画像を再構築します。クラスは、非圧縮TIFFデータとさまざまなCCITT圧縮形式の両方を処理し、異なるGroup 3およびGroup 4のバリエーションで必要とされるバイトアライメント、フィルオーダー、エンコード固有のパラメータを自動的に管理します。

関連用語

  • PDImageXObject – PDF文書に埋め込まれた画像を表すApache PDFBoxクラス
  • Image XObject – 文書コンテンツストリーム内でサンプリングされた画像を表すPDFグラフィックスオブジェクトタイプ
  • Flate compression – PDFの画像やコンテンツストリームで一般的に使用される代替の可逆圧縮方式
  • JBIG2 – 白黒画像用のPDFでサポートされている、より現代的な二値画像圧縮標準
  • Tagged PDF – アクセシビリティ準拠のための適切な画像処理が必要な構造マークアップを持つPDF文書

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html