Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Conversion incremental update

Conversion incremental updateとは、既存のPDF文書を変更する際に、文書構造全体を書き直すのではなく、ファイルの末尾に変更内容を追加するプロセスを指します。

キーワード: conversion incremental update, Conversion incremental update

概要

Conversion incremental updateとは、既存のPDF文書を変更する際に、文書構造全体を書き直すのではなく、ファイルの末尾に変更内容を追加するプロセスを指します。この技術は ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDFファイルアーキテクチャの基本であり、元のコンテンツを保持し後方互換性を維持しながら、文書を効率的に更新することを可能にします。Conversion incremental updateは、ファイル全体を再生成することなく、既存のPDFにアクセシビリティ機能、デジタル署名、またはメタデータを追加する際に特に重要です。

定義

Conversion incremental updateとは、PDF文書全体を書き直すのではなく、既存のPDFファイルに新しいセクションを追加する形で変更を書き込む、特定のタイプのPDF変更方法です。完全に新しいファイル構造を作成する全体的なPDF再生成とは異なり、incremental updateは元のPDFの末尾に新しいボディセクション、相互参照テーブル、およびトレーラーを追加します。更新されたトレーラーは新しい相互参照セクションと以前の相互参照セクションの両方を指し示し、PDFリーダーが元のオブジェクトと変更されたオブジェクトの両方にアクセスできるチェーンを作成します。このアプローチは、通常ファイル構造全体を書き直す「名前を付けて保存」操作とは異なり、また元の文書構造を破壊してしまうインプレース変更とも対照的です。

重要性

PDF処理を行う開発者にとって、conversion incremental updateを理解することは、いくつかの実用的な理由から極めて重要です。第一に、PDFファイル全体を再生成する計算オーバーヘッドなしに効率的な文書変更が可能になります。これは大容量の文書やバッチ処理を行う際に特に重要です。第二に、incremental updateは元のコンテンツに対するデジタル署名を保持しながら新しいコンテンツや機能を追加でき、文書の完全性と監査証跡を維持します。第三に、この技術は ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で定義されているようなタグ構造などのアクセシビリティ機能を既存のPDFに後付けする際に不可欠であり、開発者は元のフォーマットやコンテンツを失うことなく文書を強化できます。最後に、incremental updateは各更新レイヤーがファイル構造内でアクセス可能なまま残るため、バージョン管理と変更追跡をサポートします。

仕組み

Conversion incremental updateの技術的実装は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で概説されているPDFファイル構造仕様に従います。Incremental updateを実行する際、PDFプロセッサは既存のファイルに3つの主要なコンポーネントを追加します:変更または新規のオブジェクトを含む新しいボディセクション、これらのオブジェクトをインデックス化する新しい相互参照セクション、そして新しい相互参照セクションと以前のセクションの両方を参照する新しいトレーラー辞書です。PDFの各オブジェクトには世代番号があります。Incremental updateは元のオブジェクト番号を保持しながら、変更されたオブジェクトを増分された世代番号でマークします。PDFリーダーはファイルを末尾から後方に処理し、最新のトレーラーを使用して最新の相互参照テーブルを見つけ、次に以前の相互参照セクションのチェーンをたどって完全なオブジェクトマップを構築します。同じオブジェクト番号が複数の更新セクションに現れる場合、最新のバージョンが優先されます。この階層化されたアプローチにより、複数のincremental updateを順次適用でき、各更新がファイル構造内に変更の完全な履歴を保持します。

関連用語

  • Cross-reference table(相互参照テーブル) – PDFファイル内のオブジェクト番号をファイル内のバイトオフセットにマッピングするインデックス構造で、incremental update中のコンテンツの位置特定に不可欠です
  • PDF trailer(PDFトレーラー) – 相互参照テーブルと文書カタログへのポインタを含むPDFファイルの最終セクションで、各incremental更新時に更新されます
  • Object stream(オブジェクトストリーム) – 複数のPDFオブジェクトの圧縮されたコンテナで、ファイル効率を向上させるためにincremental updateで追加できます
  • Tagged PDF – 論理的な文書構成とアクセシビリティ情報を含むPDF構造で、で説明されているように、しばしばincremental updateを通じて既存のPDFに追加されます
  • Linearized PDF(リニアライズドPDF) – Web表示のためにPDFを最適化するファイル編成技術で、特定のファイル構造順序が必要なため、従来のincremental updateとは互換性がありません

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/