Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

This should not be confused with a

Hybrid-reference PDF ファイルは、単一のインクリメンタル更新リビジョン内に、従来型のクロスリファレンステーブルとクロスリファレンスストリームの両方を含む PDF ドキュメントです。

キーワード: this should not be confused with a, This should not be confused with a

概要

Hybrid-reference PDF ファイルは、単一のインクリメンタル更新リビジョン内に、従来型のクロスリファレンステーブルとクロスリファレンスストリームの両方を含む PDF ドキュメントです。この二重参照構造は、古い PDF リーダーとの下位互換性を維持しながら、最新の PDF プロセッサが PDF 1.5 で導入された圧縮されたストリームベースのクロスリファレンス形式を活用できるように特別に設計されています。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、このアプローチは、異なるリビジョンで従来型のクロスリファレンスセクションとクロスリファレンスストリームを別々に使用する PDF ファイルと混同してはなりません。後者は単なる標準的なインクリメンタル更新パターンです。

定義

Hybrid-reference PDF ファイルは、同一のインクリメンタル更新セクション内に、従来型のクロスリファレンステーブルとクロスリファレンスストリームが共存していることを特徴とします。従来型のクロスリファレンステーブルは、元のクロスリファレンス形式(PDF 1.4 以前)のみを理解する PDF リーダーに対して互換性を提供し、一方、クロスリファレンスストリームは、PDF 1.5 以降の仕様をサポートする最新のリーダーに対して同じ情報をより効率的で圧縮された形式で提供します。

重要な識別要素は、両方の参照構造が単一のリビジョンに存在し、同じオブジェクトに関する重複した情報を含んでいることです。これは、複数回インクリメンタル更新された PDF とは根本的に異なります。後者の場合、初期のリビジョンでは従来型のクロスリファレンステーブルを使用し、後続のリビジョンではクロスリファレンスストリームを使用する可能性がありますが、各リビジョンは一種類のクロスリファレンス構造のみを使用します。

Hybrid-reference PDF では、古い PDF リーダーはクロスリファレンスストリーム(認識できない)を無視して従来型のテーブルを使用し、新しいリーダーはより効率的なストリーム形式を選択して使用できます。この冗長性は意図的なものであり、PDF バージョン間の移行期間における互換性ブリッジとして機能します。

重要性

PDF の生成と操作を行う開発者にとって、Hybrid-reference ファイルを理解することは、いくつかの理由で重要です。

下位互換性: 古い PDF リーダーを使用するユーザーがアクセスする必要がある PDF を作成する場合、hybrid-reference 構造を実装することで、最新の PDF 機能の利点を犠牲にすることなく、可能な限り広い互換性を確保できます。

ファイルサイズの考慮事項: hybrid-reference ファイルは冗長な情報を含んでいるため(一種類の参照タイプのみを使用するファイルよりわずかに大きくなります)、クロスリファレンスストリーム部分は参照するオブジェクトに対して圧縮の利点を提供し、大きなドキュメントでは顕著な効果があります。

PDF 処理ロジック: PDF パーサーや操作ツールを構築する際、処理エラーやデータ破損を回避するために、hybrid-reference ファイルを考慮する必要があります。パーサーは両方の構造が存在する場合を認識し、その機能に基づいてどちらを使用するかを決定する必要があります。

規格準拠: ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 仕様に準拠した PDF ファイルを作成するには、特にアーカイブ目的やアクセシビリティ準拠を意図した PDF を生成する際に、hybrid-reference 構造をいつ、どのように適切に実装するかを理解する必要があります。

仕組み

Hybrid-reference PDF ファイルは、単一のインクリメンタル更新内に以下の構造要素を含みます。

従来型のクロスリファレンステーブル: このテーブルは従来の形式で表示され、キーワード xref で始まり、オブジェクト番号とバイトオフセットをリストするサブセクションが続きます。各エントリは、PDF バージョン 1.0 以降の標準である 20 バイト固定幅形式を使用します。

クロスリファレンスストリーム: この圧縮されたストリームオブジェクトには、同じクロスリファレンス情報がバイナリ形式でエンコードされています。ストリームは予測アルゴリズムと標準の PDF 圧縮(通常は Flate)を使用してサイズを削減します。ストリームの辞書には、/Type/Size/W(フィールド幅)、/Index(サブセクション境界)などの必須キーが含まれます。

トレーラーの二重性: 従来型のクロスリファレンステーブルの後には、トレーラー辞書(trailer キーワードでマークされる)が続き、一方、クロスリファレンスストリームオブジェクトは独自の辞書を持ちます。両方とも重要なドキュメントカタログ情報を含みますが、通常、クロスリファレンスストリームの辞書がそれをサポートするリーダーに対して優先されます。

PDF リーダーが hybrid-reference ファイルを開くと、最初に従来型のクロスリファレンステーブルに遭遇します。PDF 1.4 以前のみをサポートするリーダーはそこで停止し、このテーブルを使用してオブジェクトを特定します。PDF 1.5 以降の仕様をサポートする最新のリーダーは、クロスリファレンスストリームの存在(通常はトレーラーで参照される)を認識し、代わりにそれを使用してより効率的な処理を行うことができます。

hybrid 構造は、PDF 生成時に以下の手順で作成されます。

  1. 圧縮されたオブジェクト位置データを含むクロスリファレンスストリームを構築する
  2. 同じ情報を抽出して、並列の従来型クロスリファレンステーブルを作成する
  3. 両方の構造が同じドキュメント状態を正確に反映していることを確認する
  4. 適切なトレーラー情報とともに、両方を同じインクリメンタル更新セクションに配置する

関連用語

  • Cross-Reference Table(クロスリファレンステーブル) – オブジェクト番号をバイトオフセットにマッピングするプレーンテキスト形式を使用する、元の PDF 構造
  • Cross-Reference Stream(クロスリファレンスストリーム) – PDF 1.5 で導入された、クロスリファレンス情報をバイナリ形式で格納する圧縮されたストリームオブジェクト
  • Incremental Update(インクリメンタル更新) – ドキュメント全体を書き直すのではなく、ファイルの末尾に変更を追加することで PDF を変更する方法
  • Trailer Dictionary(トレーラー辞書) – PDF ファイルまたは更新セクションの最後にある辞書で、ドキュメントカタログとクロスリファレンス情報へのポインタを含む
  • Object Stream(オブジェクトストリーム) – 複数の PDF オブジェクトを含むことができる圧縮されたストリームで、ファイルサイズを削減し効率を向上させる

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html