Info dictionary
Info dictionaryは、PDF文書における従来型のメタデータ機構であり、タイトル、著者、件名、キーワード、作成アプリケーション、生成ソフトウェア、作成日時・更新日時などの基本的な文書情報を格納します。
Info dictionaryは、PDF文書における従来型のメタデータ機構であり、タイトル、著者、件名、キーワード、作成アプリケーション、生成ソフトウェア、作成日時・更新日時などの基本的な文書情報を格納します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。現代のPDF仕様では後方互換性のために引き続きサポートされていますが、文書メタデータを格納する推奨手段としてはXMPメタデータストリームに取って代わられています。それでもInfo dictionaryは広く使用されており、PDF生成ソフトウェアによって自動的に設定されることが多くあります。
Info dictionaryは、PDFファイルのtrailer内に配置される任意のdictionaryオブジェクトで、文書レベルのメタデータを記述するキーと値のペアを含みます。/Title、/Author、/Subject、/Keywords、/Creator、/Producer、/CreationDate、/ModDateなどの定義済みキーを使用したシンプルな文字列エントリを持ちます。後に導入されたより構造化されたXMPメタデータシステムとは異なり、Info dictionaryはメタデータを平坦な構造のプレーンテキスト文字列として格納し、複雑な関係性や標準化されたスキーマをサポートしていません。PDF 2.0以降のバージョンでは、Info dictionaryは依然として有効ですが、両方が存在する場合、document catalogのMetadataストリーム内のXMPメタデータが正式な情報源とみなされます
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
PDF生成または操作を行う開発者にとって、Info dictionaryはいくつかの理由で重要です。第一に、多くのレガシーPDFリーダーや文書管理システムは、文書プロパティの表示や検索の実行においてInfo dictionaryのみに依存しています。第二に、PDF/UA-1のようなPDFアクセシビリティ標準では、Info dictionaryまたはXMPストリームのいずれかに存在するメタデータに対する注意深い対応が求められます ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。第三に、プログラムでPDFを作成または変更する際、開発者は最大限の互換性を得るためにInfo dictionaryのみを設定するか、標準準拠のためにXMPメタデータのみを設定するか、または両方を設定するか(この場合、矛盾する情報を避けるための慎重な同期が必要)を決定する必要があります。Info dictionaryを理解することは、異なるPDFバージョン間でメタデータの整合性を維持し、さまざまなPDFビューアで文書情報が正しく表示されることを保証するために不可欠です。
Info dictionaryは、PDFファイルのtrailer dictionaryから/Infoキーを使用して参照され、このキーがメタデータエントリを含む間接オブジェクトを指します。Info dictionary内の各エントリは、スラッシュで始まる定義済みのキー名を使用し、テキスト文字列または日付値とペアになります。例えば、基本的なInfo dictionaryは<< /Title (Annual Report 2024) /Author (John Smith) /CreationDate (D:20240115103000Z) >>のような内容を含む場合があります。日付値は「D:」で始まり、YYYYMMDDHHmmSSが続き、オプションでタイムゾーン情報が付加される特定の形式に従います。Info dictionaryとXMPメタデータストリームの両方が文書内に存在する場合、PDF 2.0ではXMPが優先されると規定されていますが、アプリケーションは後方互換性のために両方を同期することがあります
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。開発者は、PDFライブラリを通じて文書trailerをたどり、Info dictionaryオブジェクトを取得し、その文字列エントリを更新することで、Info dictionaryにアクセスして変更できます。
- XMPメタデータ – PDF 2.0でInfo dictionaryに取って代わる、XMLベースの最新メタデータシステム
- Document catalog – XMP Metadataストリームを含む、PDF文書構造のルートオブジェクト
- Trailer dictionary – Info dictionaryへの参照を含むPDFファイル構造のコンポーネント
- PDF/UA – アクセシブルなPDFにおける文書メタデータの要件を定義するアクセシビリティ標準
- Metadataストリーム – XMP形式の構造化されたメタデータを含む埋め込みXMLストリーム
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
