Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

TIFF

TIFF(Tagged Image File Format)は、文書イメージングやスキャンワークフローで広く使用されている、汎用性が高くプラットフォーム非依存の画像コンテナ形式です。

カテゴリ: General PDF Concepts
キーワード: tiff, TIFF

概要

TIFF(Tagged Image File Format)は、文書イメージングやスキャンワークフローで広く使用されている、汎用性が高くプラットフォーム非依存の画像コンテナ形式です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDF文書に画像を埋め込む際、TIFFは特にスキャンされた文書の元形式として一般的に使用されます。1つのファイルに複数ページを含むことができるためです。さまざまな色空間、圧縮方式、メタデータを格納できる柔軟性により、文書保存やPDF変換において自然な選択肢となっています。

定義

TIFFは、タグベースの構造を使用して画像データと画像特性を記述するメタデータを格納するラスター画像ファイル形式です。BMPJPEGのようなシンプルな形式とは異なり、TIFFは1つのファイル内に複数の画像(ページ)を含むことができ、さまざまな圧縮方式(LZW、CCITT Group 4、非圧縮など)をサポートし、異なる色モデル(グレースケール、RGB、CMYK、インデックスカラー)に対応できます。カスタムタグによる拡張性により、解像度、カラープロファイル、注釈などの追加情報を格納することができます。PDFワークフローでは、TIFFファイルは頻繁にPDF形式に変換され、通常、各TIFFページが結果のPDF文書内の個別のページになります。TIFF自体はPDFのネイティブ画像形式ではありませんが、PDF文書を作成する際、TIFFファイルの画像データは一般的に抽出され、PDF互換の圧縮方式を使用して再エンコードされます。

重要性

PDF生成や文書管理システムを扱う開発者にとって、TIFFを理解することは極めて重要です。なぜなら、TIFFはスキャンされた文書入力の支配的な形式であり続けているからです。多くのエンタープライズ文書ワークフローは、スキャナ、ファックス機、文書イメージングシステムによって生成されたTIFFファイルから始まります。これらのファイルを ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの規格に準拠したアクセシブルなPDFに変換する際、開発者は画質を保持しながらファイルサイズを最適化するために、TIFFのさまざまな圧縮方式と色空間を正しく処理する必要があります。マルチページTIFFファイルは特に課題があり、ページを反復処理し、検索可能でタグ付けされたPDFを作成するためにOCR(光学文字認識)を適用するロジックが必要になる場合があります。TIFF入力を効率的に処理する能力は、エンタープライズ環境における文書変換パイプラインのパフォーマンスと信頼性に直接影響します。

仕組み

TIFFファイルは、IFD(Image File Directory)構造を使用します。この構造では、ファイル内の各画像が、幅、高さ、サンプルあたりのビット数、圧縮方式、測光解釈などのプロパティを指定する一連のタグによって記述されます。TIFFをPDFに変換する際、開発者は通常、次の処理を行う必要があります:IFDを読み取って画像特性を理解する、必要に応じて画像データを解凍する、色空間をPDF互換形式(通常はDeviceRGB、DeviceGray、またはDeviceCMYK)に変換する、DCTDecode(JPEG)、FlateDecode、またはJBIG2DecodeなどのPDF画像エンコーディングを使用して再圧縮する。マルチページTIFFの場合、各IFDが順次処理され、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で概説されているように、各画像がPDF構造内の個別のページオブジェクトになります。LibTIFF、ImageMagick、各種Java画像APIなどのライブラリは、TIFFファイルを解析するための低レベル機能を提供し、PDFライブラリはPDF Image XObjectへの変換と文書構造への統合を処理します。

関連用語

  • Image XObject – PDF文書に埋め込まれた画像を表現するために使用されるPDFオブジェクトタイプ
  • Compression – JPEG、Flate、CCITTエンコーディングなど、ファイルサイズを削減するために使用される方式
  • Raster Image – ベクターグラフィックスとは対照的なピクセルベースの画像
  • OCR(Optical Character Recognition) – 検索可能なPDFのためにスキャン画像からテキストを抽出する技術
  • Device Color Space – PDF画像処理で使用されるDeviceRGBやDeviceGrayなどの色モデル

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html