Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

ハイブリッド参照PDFファイル(Hybrid-reference PDF)

Hybrid-reference PDF ファイルとは、同一ファイル内に標準的なクロスリファレンステーブルとクロスリファレンスストリームの両方によって参照されるオブジェクトを含む PDF 1.5(またはそれ以降)のドキュメントです。

キーワード: a hybrid-reference pdf file is a, A Hybrid-reference PDF file is a

概要

Hybrid-reference PDF ファイルとは、同一ファイル内に標準的なクロスリファレンステーブルとクロスリファレンスストリームの両方によって参照されるオブジェクトを含む PDF 1.5(またはそれ以降)のドキュメントです ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このハイブリッド構造により、新しい PDF 機能と古い PDF リーダーに対する後方互換性が共存できます。Hybrid-reference ファイルは、現代の PDF ライターが既存の PDF ドキュメントにコンテンツを追加する際のインクリメンタルアップデート(増分更新)によって一般的に作成されます。

定義

Hybrid-reference PDF は、単一の PDF ファイル内でオブジェクトの位置を追跡する2つの異なる方法を組み合わせたものです。従来のクロスリファレンステーブル(PDF 1.0 以降で使用)は、各オブジェクトのバイトオフセットをリストアップするプレーンテキスト構造です。一方、クロスリファレンスストリーム(PDF 1.5 で導入)は、同じ目的をより効率的に果たす圧縮されたバイナリストリームです。Hybrid-reference ファイルでは、一部のオブジェクトは従来のテーブルを通じて参照され、他のオブジェクトはストリームを通じて参照されます。これは通常、異なる機能を持つ複数の PDF プロセッサによってファイルがインクリメンタルに更新されたためです。

これは、純粋なクロスリファレンステーブル PDF(バージョン 1.5 以前)や純粋なクロスリファレンスストリーム PDF(すべての参照がストリームを使用)とは異なります。ハイブリッドアプローチは、PDF 1.4 以前のファイルが PDF 1.5 以上に準拠したライターによって変更され、元のクロスリファレンステーブル構造を保持したまま、クロスリファレンスストリームを使用して新しいコンテンツが追加される場合に自然に発生します。

重要性

PDF ファイルを扱う開発者にとって、Hybrid-reference PDF を理解することは以下の理由から重要です。

互換性への配慮: PDF プロセッサやバリデーターを構築する際、同じドキュメント内の両方の参照タイプを処理できるコードが必要です。ハイブリッド構造を認識しないと、不完全な解析やコンテンツの見落としにつながる可能性があります。

インクリメンタルアップデートのワークフロー: アプリケーションが既存の PDF にインクリメンタルアップデート(注釈、フォームデータ、デジタル署名の追加など)を実行する場合、ハイブリッド構造を維持するか、単一の参照タイプに正規化するかを決定する必要があります。

ファイルの最適化: Hybrid-reference ファイルは必要以上に大きくなる可能性があります。この構造を理解することで、ドキュメントの整合性を維持しながら参照を統合できる最適化ルーチンの実装に役立ちます。

デバッグとトラブルシューティング: 破損または不正な形式の PDF を調査する際、Hybrid-reference パターンを認識することで、どの処理段階が特定のオブジェクトを導入したか、また潜在的な互換性の問題を特定するのに役立ちます。

仕組み

Hybrid-reference PDF は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている標準的な PDF ファイル構造に従い、以下の主要な特性を持ちます。

ファイル構造: PDF には、従来のクロスリファレンステーブル(xref キーワードで始まる)と1つ以上のクロスリファレンスストリーム(/Type /XRef を持つストリームオブジェクト)の両方が含まれます。ファイルトレーラーまたは後続の更新セクションは、これらの異なる参照構造を指します。

オブジェクトの解決: PDF リーダーがオブジェクトを特定する必要がある場合、正しいバイトオフセットを見つけるために、クロスリファレンステーブルとクロスリファレンスストリームの両方を確認する必要があります。以前の更新で追加されたオブジェクトは通常クロスリファレンステーブルに表示され、後の更新からのオブジェクトはクロスリファレンスストリームに表示される場合があります。

インクリメンタルアップデートチェーン: PDF への各インクリメンタルアップデートは、新しいボディセクション、クロスリファレンスセクション、トレーラーを追加します。ハイブリッドファイルでは、一部の更新は従来のテーブルを使用し、他の更新はストリームを使用します。リーダーは、すべてのオブジェクト参照を解決するために、最新の更新から逆方向にこのチェーンを辿る必要があります。

ポインタ階層: ファイルのメイントレーラーまたは最新のインクリメンタルアップデートのトレーラーには、前のクロスリファレンスセクション(テーブルまたはストリーム)を指す /Prev エントリが含まれます。これにより、リーダーが完全なオブジェクトマップを構築するために従う必要があるリンクチェーンが作成されます。

圧縮の違い: クロスリファレンスストリームは標準的な PDF フィルタを使用して圧縮でき、多数のオブジェクトを持つドキュメントのファイルサイズを大幅に削減できます。従来のテーブルはプレーン ASCII テキストであり、クロスリファレンス構造自体内で圧縮することはできません。

関連用語

  • Cross-reference table(クロスリファレンステーブル) – PDF ファイル内のオブジェクトの位置を追跡するための元のプレーンテキスト構造。PDF 1.0 から 1.4 まで使用され、後のバージョンでもサポートされています
  • Cross-reference stream(クロスリファレンスストリーム) – PDF 1.5 で導入された圧縮ストリームオブジェクトで、オブジェクトの位置情報をより効率的に保存する方法を提供します
  • Incremental update(インクリメンタルアップデート) – ドキュメント全体を書き直すのではなく、ファイルの末尾に変更を追加することで PDF を変更する方法。Hybrid-reference 構造を作成する可能性があります
  • PDF file trailer(PDF ファイルトレーラー) – PDF ファイル(またはインクリメンタルアップデート)の最終セクションで、メタデータとクロスリファレンスセクションへのポインタが含まれます
  • Object stream(オブジェクトストリーム) – 圧縮されたストリーム内に複数のオブジェクトを保存する PDF 1.5 以降の機能。クロスリファレンスストリームと併用されることが多いです

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html