Document properties
Document propertiesは、PDF の Info ディクショナリに格納される人間が読めるメタデータフィールドで、タイトル、著者、件名、キーワードなどの文書の特性を記述します。
Document propertiesは、PDF の Info ディクショナリに格納される人間が読めるメタデータフィールドで、タイトル、著者、件名、キーワードなどの文書の特性を記述します。これらのプロパティは、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) において PDF 仕様のメタデータシステムの一部として定義されています。Document properties は、PDF リーダーでユーザーが閲覧でき、文書管理システムで利用できる記述情報を追加するためのシンプルな方法を提供します。
Document properties は、PDF ファイルのオプションである Info ディクショナリに格納されるキーと値のペアです。最も一般的な標準プロパティには以下が含まれます:
- Title – 文書のタイトル
- Author – 文書を作成した人の名前
- Subject – 文書の主題の説明
- Keywords – 文書に関連付けられた検索キーワード
- Creator – 元の文書を作成したアプリケーション
- Producer – PDF に変換または生成したアプリケーション
- CreationDate – 文書が作成された日時
- ModDate – 文書が最後に変更された日時
Document properties は Info ディクショナリに存在しますが、XML を使用したより構造化された拡張可能なメタデータフレームワークを提供する XMP メタデータとは異なります。Document properties はよりシンプルで制限がありますが、後方互換性のために広くサポートされ続けています。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によると、Info ディクショナリは主に以前の PDF バージョンとの互換性のために維持されていますが、現代の XMP メタデータストリームと並行して使用され続けています。
Document properties は、PDF 生成または処理システムを実装する開発者にとって以下の理由で重要です:
- 検索可能性の実現 – ユーザーはファイルブラウザや文書管理システムにおいて、タイトル、著者、キーワードに基づいて文書を検索し識別できます
- 文書ワークフローのサポート – メタデータは、組織が文書を自動的に分類、ルーティング、処理するのに役立ちます
- アクセシビリティの向上 – ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) アクセシビリティガイドラインで指摘されているように、文書タイトルは、文書を素早く識別する必要があるスクリーンリーダーユーザーにとって特に重要です
- 監査証跡の提供 – 作成日時と変更日時は文書履歴の追跡に役立ちます
- コンプライアンスの確保 – 多くの規制や組織標準では、適切な文書メタデータが要求されます
XMP メタデータが現代の標準であっても、多くのレガシーシステムや PDF リーダーが Info ディクショナリに依存しているため、Document properties は相互運用性にとって不可欠であり、関連性を保ち続けています。
Document properties は、PDF ファイルのトレーラーディクショナリの /Info キーの下に格納され、Info ディクショナリオブジェクトを参照します。PDF を作成または変更する際、開発者は PDF ライブラリを通じて、Info ディクショナリに適切なキーと値のペアを設定することで、これらのプロパティを設定できます。
基本構造の例:
/Info <<
/Title (Annual Report 2024)
/Author (Jane Smith)
/Subject (Financial Summary)
/Keywords (finance, annual, revenue)
/Creator (Microsoft Word)
/Producer (PDF Library 3.0)
/CreationDate (D:20240115103000Z)
/ModDate (D:20240115103000Z)
>>
日付形式は、“D:” で始まり、YYYYMMDDHHmmSS とオプションのタイムゾーン情報が続く、PDF 固有の日付文字列形式を使用します。テキスト文字列は国際文字をサポートするために適切にエンコードする必要があり、通常は Unicode テキストにはバイトオーダーマーク付きの UTF-16BE エンコーディングを使用します。
Document properties を実装する際、開発者は以下を行うべきです:
- 最大限の互換性を得るために、Info ディクショナリと XMP メタデータの両方を設定する
- プロパティを更新する際、2 つのメタデータシステムの同期を保つ
- 特殊文字が正しく表示されるようにテキストエンコーディングを検証する
- 著者やシステム情報を含める際のプライバシーへの影響を考慮する
ほとんどの PDF ライブラリは、Info ディクショナリ構造を直接操作することなく、Document properties を設定するための高レベル API を提供しています。
- XMP metadata – Info ディクショナリプロパティを補完または置き換える、現代的で拡張可能な XML ベースのメタデータシステム
- Info dictionary – Document properties をキーと値のペアとして格納する PDF オブジェクト構造
- Document catalog – メタデータを含む主要な文書コンポーネントへの参照を含む、PDF 文書のルートオブジェクト
- Metadata stream – XML 形式の XMP メタデータを含むストリームオブジェクト
- Tagged PDF – アクセシビリティ情報を含み、ユーザーエクスペリエンス向上のために Document properties を参照する可能性がある構造化 PDF 形式
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
