サムネイル生成とは、PDFページの小さな低解像度のプレビュー画像を作成するプロセスであり、ドキュメント内を素早く視覚的にナビゲートできるようにします。これらのサムネイルは、完全なページレンダリングを必要とせずに、ユーザーにページコンテンツの視覚的な概要を提供します。PDF仕様
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
では、ユーザーエクスペリエンスを向上させるために、サムネイルをオプションのページ属性としてPDFドキュメント内に埋め込む方法が定義されています。
サムネイル生成は、PDFページの縮小されたビットマップ表現を作成することを含み、通常、幅または高さが100から200ピクセルの範囲になります。これらのプレビュー画像は、PDF構造内でimage XObjectとして保存され、ドキュメント作成時に事前生成するか、必要に応じてPDFビューアアプリケーションによって動的に作成できます。完全なページレンダリングとは異なり、サムネイルは詳細な精度よりも速度とメモリ効率を優先し、縮小された寸法では見えない細かい詳細、注釈、またはインタラクティブ要素を省略することがよくあります。サムネイルは、コンテンツレビューではなくナビゲーションインターフェース用に特別に最適化されている点で、ページプレビューとは異なります。
PDFビューアまたはドキュメント管理システムを実装する開発者にとって、サムネイル生成は、ユーザーが複数ページのドキュメントを素早く閲覧できる直感的なナビゲーションインターフェースを作成するために不可欠です。PDF作成時にサムネイルを事前生成して埋め込むことで、特にベクターグラフィックス、フォント、または透明度を含む複雑なページを持つドキュメントの場合、繰り返しのレンダリング操作を回避することでアプリケーションのパフォーマンスを大幅に向上させることができます。サムネイルの実装を理解することは、開発者がファイルサイズ(埋め込みサムネイルはドキュメントサイズを増加させる)とランタイムパフォーマンス(オンデマンド生成には処理時間が必要)のバランスを取るのに役立ちます。適切に実装されたサムネイルは、大きなドキュメントでもレスポンシブなナビゲーションを提供することで、Webアプリケーション、モバイルビューア、デスクトップソフトウェアでのユーザーエクスペリエンスを向上させます。
TIFF(Tagged Image File Format)は、文書イメージングやスキャンワークフローで広く使用されている、汎用性が高くプラットフォーム非依存の画像コンテナ形式です。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で定義されているPDF文書に画像を埋め込む際、TIFFは特にスキャンされた文書の元形式として一般的に使用されます。1つのファイルに複数ページを含むことができるためです。さまざまな色空間、圧縮方式、メタデータを格納できる柔軟性により、文書保存やPDF変換において自然な選択肢となっています。
TIFFは、タグベースの構造を使用して画像データと画像特性を記述するメタデータを格納するラスター画像ファイル形式です。BMPやJPEGのようなシンプルな形式とは異なり、TIFFは1つのファイル内に複数の画像(ページ)を含むことができ、さまざまな圧縮方式(LZW、CCITT Group 4、非圧縮など)をサポートし、異なる色モデル(グレースケール、RGB、CMYK、インデックスカラー)に対応できます。カスタムタグによる拡張性により、解像度、カラープロファイル、注釈などの追加情報を格納することができます。PDFワークフローでは、TIFFファイルは頻繁にPDF形式に変換され、通常、各TIFFページが結果のPDF文書内の個別のページになります。TIFF自体はPDFのネイティブ画像形式ではありませんが、PDF文書を作成する際、TIFFファイルの画像データは一般的に抽出され、PDF互換の圧縮方式を使用して再エンコードされます。
PDF生成や文書管理システムを扱う開発者にとって、TIFFを理解することは極めて重要です。なぜなら、TIFFはスキャンされた文書入力の支配的な形式であり続けているからです。多くのエンタープライズ文書ワークフローは、スキャナ、ファックス機、文書イメージングシステムによって生成されたTIFFファイルから始まります。これらのファイルを
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
などの規格に準拠したアクセシブルなPDFに変換する際、開発者は画質を保持しながらファイルサイズを最適化するために、TIFFのさまざまな圧縮方式と色空間を正しく処理する必要があります。マルチページTIFFファイルは特に課題があり、ページを反復処理し、検索可能でタグ付けされたPDFを作成するためにOCR(光学文字認識)を適用するロジックが必要になる場合があります。TIFF入力を効率的に処理する能力は、エンタープライズ環境における文書変換パイプラインのパフォーマンスと信頼性に直接影響します。
Tiny text removal thresholdは、PDF処理で使用される変換オプションで、出力ドキュメントから極めて小さいテキスト要素をフィルタリングまたは除外します。このしきい値は通常、最小フォントサイズ(ポイント単位)として定義され、変換操作中にこれを下回るテキストコンテンツが除外されます。PDF仕様
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
では特定のテキストサイズ要件は規定されていませんが、この機能はユーザーに見えない、または判読不可能なテキストを削除することで、ドキュメント処理を最適化します。
Tiny text removal thresholdは、PDF変換および処理ワークフローにおける設定可能なパラメータで、最小テキストサイズ基準を確立します。有効化すると、指定されたしきい値よりも小さいフォントサイズでレンダリングされたテキストは、結果として生成される出力から自動的に削除されます。これはテキストの可視性設定や不透明度制御とは異なり、視覚的プロパティではなく実際のフォントサイズメトリックに基づいて動作します。この機能は、PDFを他の形式(HTML、画像、アクセシブルなドキュメントなど)に変換する際に特に有用です。極小のテキスト要素は実用的な目的を果たさず、処理の複雑化やアクセシビリティの問題を引き起こす可能性があるためです。
PDF変換パイプラインを扱う開発者にとって、tiny text removal thresholdはいくつかの実用的な利点を提供します。第一に、コンテンツ抽出やアクセシビリティワークフローを妨げる可能性のある装飾的または隠されたテキスト要素を排除することで、出力ドキュメントをクリーンアップします。第二に、分析、レンダリング、または変換が必要なテキストオブジェクトの量を削減することで、処理パフォーマンスを向上させることができます。第三に、PDF/UA
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
などの標準に準拠したアクセシブルなドキュメントを作成する際、知覚できないほど小さいテキストを削除することで、スクリーンリーダーやその他の支援技術における混乱を防ぎます。最後に、PDFにセキュリティ透かし、トラッキング要素、または変換後の出力に表示すべきでないその他のマイクロテキストが含まれている場合に対処するのに役立ちます。
Transformation matrixは、PDF内のグラフィックスやテキスト操作において、ある座標系から別の座標系へ座標をマッピングする方法を定義する、6つの数値で構成される数学的構造です。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で規定されているように、これらのアフィン変換により、PDF文書内のグラフィック要素やテキストの拡大縮小、回転、平行移動、傾斜が可能になります。Transformation matrixは、PDFの座標ベースのレンダリングモデルの基礎であり、ページ上のコンテンツの配置と外観を正確に制御できます。
PDFにおけるtransformation matrixは、6つの数値[a b c d e f]で表される3×3行列であり、第3列は暗黙的に[0 0 1]となっています。これらの6つの値は、座標(x, y)を新しい座標(x’, y’)にマッピングするアフィン変換を定義し、以下の式を使用します:
- x’ = a × x + c × y + e
- y’ = b × x + d × y + f
行列パラメータは特定の変換の側面を制御します:aとdはxとy方向の拡大縮小を制御し、bとcは回転と傾斜を制御し、eとfはxとy軸に沿った平行移動(移動)を制御します。一般的な行列変換とは異なり、アフィン変換は平行線と線に沿った距離の比を保持するため、2Dグラフィックス操作に最適です。Transformation matrixは、単純な座標オフセットとは異なり、複数の操作を単一の数学的構造で複雑に組み合わせることができます。
TrimBoxは、PDF文書におけるページ境界の一つで、印刷製造工程で余分な用紙を断裁した後の完成ページの意図された寸法を定義します
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。これは、印刷時に使用される物理的なメディアサイズよりも通常小さい、裁断後の印刷ページの最終サイズを表します。TrimBoxの理解は、印刷用PDFやドキュメントレンダリングシステムを扱う開発者にとって、製造上の補助要素と最終的なコンテンツ境界を区別する上で不可欠です。
TrimBoxは、PDF仕様で定義されている複数の境界ボックスの一つで、ページの表示と処理方法を制御します
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。これは、商業印刷の仕上げ工程でページを物理的に裁断すべき位置を具体的に示します。物理メディア(用紙)のサイズを定義するMediaBoxとは異なり、TrimBoxは断裁後のより小さい最終ページサイズを定義します。PDFでTrimBoxが明示的に指定されていない場合、MediaBoxの寸法がデフォルトとなり、断裁の意図がないことを意味します。
User spaceは、PDFドキュメント内でコンテンツの配置とレンダリングに使用されるデフォルトの座標系です
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。これは2次元平面を定義し、座標は通常1インチの1/72に相当する単位で測定されます。この単位は、タイポグラフィで伝統的に使用されるポイント測定に近いものです。PDF内のすべてのグラフィカルオブジェクト、テキスト、画像は、変換が適用される前に、最初にuser space座標を使用して指定されます。
User spaceは、PDFコンテンツストリームがグラフィカル要素の位置と寸法を記述する基本的な座標系です。デフォルトでは、原点(0,0)はページの左下隅に配置され、x軸は右に、y軸は上に伸びています
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。User spaceの基本測定単位は1/72インチで、つまり72 user space単位が1インチに等しくなります。これはPostScriptから継承された慣例で、伝統的な印刷ポイントと一致します。
Windows Metafile(WMF)は、Microsoft が開発したグラフィックスファイル形式で、ベクトル画像データとビットマップ画像データの両方を格納するコンテナとして機能します。PDF開発において、WMFファイルは、Windowsベースのドキュメントを変換する際や、Microsoft アプリケーションからのグラフィックスをPDF形式に埋め込む際によく遭遇します
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。Windows環境からのコンテンツを処理するドキュメント変換パイプラインに携わる開発者にとって、WMFの理解は不可欠です。
WMFは、画像をWindows Graphics Device Interface(GDI)への一連の関数呼び出しとして保存する16ビットのグラフィックス形式です。ピクセルデータを保存するJPEGやPNGなどの純粋なラスター形式や、SVGのような純粋なベクトル形式とは異なり、WMFは同一ファイル内にベクトルグラフィックス(線、曲線、図形)とラスター画像の両方を含むことができます。この形式は本質的に、元のグラフィックを再現するために再生可能な描画コマンドのシーケンスを記録します。
WMFは、その後継となるEnhanced Metafile(EMF)とは異なります。EMFは32ビット形式であり、拡張された機能とより優れたカラーサポートを提供します。両形式ともGDI呼び出しを記録するという同じ基本原理を使用していますが、EMFは改善された機能を提供し、現代のアプリケーションでは一般的に推奨されています。しかし、WMFはレガシーシステムや古いドキュメント形式で広く使用されているため、依然として関連性があります。
PDF開発者にとって、WMFのサポートは、特にMicrosoft Officeドキュメント、レガシーWindowsアプリケーション、またはエンタープライズコンテンツ管理システムを処理するドキュメント変換ツールを構築する際に重要です。多くの古いドキュメントやテンプレートにはWMFグラフィックスが含まれており、ドキュメント生成ワークフロー中にPDF互換形式へ正確に変換する必要があります。
Word spacing(Tw)は、PDFのテキスト状態パラメータの一つで、テキスト文字列内の単語間に挿入される水平方向の追加スペース量を制御します。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で定義されているように、word spacingはcharacter spacingと連携してページ上のテキストの正確な配置を制御します。このパラメータはスペース文字(ASCII コード32)のみに影響し、スケーリングされていないテキスト空間単位で測定されます。
Word spacingは、PDF文書内でテキストをレンダリングする際に単語間に追加される余分なスペースを指定する数値です。PDFのテキストレンダリングモデルにおいて、word spacingはcharacter spacingとは異なります。character spacing(Tc)が文字列内のすべてのグリフに影響するのに対し、word spacingは単語区切り文字(通常はスペース文字)のみに適用されます。word spacing値は、フォントで定義されたスペース文字の標準幅に加算され、両端揃えのテキスト、タイポグラフィの調整、または特定のレイアウト要件を実現します。Word spacingはPDFコンテンツストリーム内のTwオペレータを使用して設定され、別のTwオペレータによって変更されるか、グラフィックス状態がリセットされるまで有効です。
PDFの生成や操作を行う開発者にとって、word spacingを理解することはいくつかの理由から不可欠です。第一に、適切なword spacing制御はテキストの両端揃えアルゴリズムにとって重要です。左右の余白を揃えるには、テキスト行全体でword spacingを動的に調整する必要があります。第二に、PDFからテキストを抽出または解析する際、word spacing値はテキストの解釈方法と単語境界の位置に影響を与え、検索機能とコンテンツ抽出の精度に影響します。第三に、アクセシビリティの観点では、word spacingが過度に大きいと認知障害を持つユーザーの可読性を損なう可能性があるため、
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
などの標準に準拠したアクセシブルなPDFを生成する際には、これらの値を監視することが重要です。最後に、プログラムによるPDFテキストの再現や編集では、視覚的な忠実性を維持するためにword spacing値を理解し、場合によっては変更する必要があります。
XML Forms Architecture(XFA)は、PDF文書内でインタラクティブフォームを定義するために歴史的に使用されてきた、独自仕様のXMLベースのフォーマットです。従来のAcroForm技術とは異なり、XFAはフォーム構造とデータをPDFネイティブの辞書構造ではなく、XMLスキーマを使用して表現します。XFAは以前のPDFバージョンでサポートされていましたが、PDF 2.0では非推奨となりました
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
XML Forms Architectureは、フォームフィールドの定義、レイアウト情報、ビジネスロジックをXML形式でエンコードし、それをPDFファイル内に埋め込むフォーム技術です。XFAフォームはAcroFormとは根本的に異なるアプローチを取ります。AcroFormがインタラクティブ要素を定義するためにPDFネイティブのアノテーションやフィールドオブジェクトを使用するのに対し、XFAは視覚的なプレゼンテーションとデータ構造の両方を記述するXMLストリームとして、フォーム構造全体を定義します。XFAフォームは、静的(固定レイアウト)または動的(データやユーザー入力に基づいてフォームレイアウトが調整される)のいずれかになります。XFA仕様はAdobeによって維持されていましたが、ISO標準にはなりませんでした。これにより、PDFプロセッサー間での相互運用性が制限され、最終的にPDF 2.0で非推奨となりました
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
XObjectは、PDF内で再利用可能な外部オブジェクトであり、文書構造内で名前付きリソースとして存在します
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。XObjectは、画像、Form XObject(自己完結型のコンテンツストリーム)、またはDoオペレータを使用して複数回呼び出されるPostScriptフラグメントのいずれかです。この設計により、PDFファイルはデータを複製することなく、文書全体で同じグラフィカルコンテンツを効率的に参照できます。
XObjectは、表示されるページのコンテンツストリームとは別にグラフィカルコンテンツを定義するPDFオブジェクトです。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
によれば、XObjectには3つのタイプがあります:Image XObject(ラスター画像またはビットマップ画像)、Form XObject(再利用可能なベクターグラフィックスとテキスト)、PostScript XObject(PostScript言語フラグメント、PDF 2.0では非推奨)。ページのコンテンツストリーム内で直接描画されるインラインコンテンツとは異なり、XObjectはPDFファイル内の間接オブジェクトとして保存され、ページのリソース辞書から名前で参照されます。コンテンツストリームがDoオペレータとそれに続くXObject名に遭遇すると、PDFプロセッサはそのXObjectのコンテンツを現在のグラフィックス状態の位置に描画します。この分離により、同じXObjectを重複したコンテンツを保存することなく、異なるページで複数回呼び出すことができます。