Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

XMP metadata

XMP metadata(Extensible Metadata Platform)は、PDF文書内にリッチで構造化されたメタデータを埋め込むためのXMLベースの標準規格です。

キーワード: xmp metadata, XMP metadata

概要

XMP metadata(Extensible Metadata Platform)は、PDF文書内にリッチで構造化されたメタデータを埋め込むためのXMLベースの標準規格です。限定的なキー・バリューペアを提供する従来の文書情報辞書とは異なり、XMPは拡張可能で標準化されたメタデータを可能にし、文書のプロパティ、権利管理、著作者情報、カスタムフィールドを機械可読形式で記述できます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。XMP metadataはPDFファイル構造内に独立したストリームオブジェクトとして保存されるため、異なるアプリケーションやワークフロー間でも保持されることが保証されます。

定義

XMP metadataは、AdobeのExtensible Metadata Platform仕様に準拠したXMLデータのパケットで、PDF内に埋め込まれます。Dublin Core(dc:)、XMP Basic(xmp:)、PDF固有のプロパティ(pdf:)などのスキーマに整理された名前空間付きプロパティで構成されています。メタデータはRDF(Resource Description Framework)形式で保存されるため、文書情報辞書で利用可能な単純なテキスト文字列をはるかに超える、複雑な関係性や階層的なデータ構造を扱えます。

PDFの従来の文書情報辞書が/Title/Author/Subjectなどの固定キーを使用するのに対し、XMP metadataは無制限のカスタムプロパティ、多言語値、構造化配列、標準化されたボキャブラリをサポートします。これにより、詳細なメタデータが不可欠なプロフェッショナル出版ワークフロー、デジタルアセット管理システム、アクセシビリティアプリケーションで特に価値があります ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

重要性

PDF生成または処理を行う開発者にとって、XMP metadataはいくつかの重要な利点を提供します。第一に、独自フィールドではなく標準化されたスキーマを使用することで、異なるソフトウェアプラットフォームや組織間の相互運用性を実現します。第二に、言語情報、文書構造メタデータ、および支援技術に必要なその他のデータを保存することで、アクセシビリティ要件をサポートします。第三に、XMP metadataは文書の変換を通じて保持され、PDF全体を解析することなく検索エンジンやコンテンツ管理システムによって抽出・インデックス化できます。

XMPの理解は、文書の来歴を追跡したり、権利管理を実装したり、PDF/A(アーカイブ)やPDF/UA(ユニバーサルアクセシビリティ)などのPDF標準に準拠したりする必要があるシステムを構築する際に特に重要です ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。多くのエンタープライズコンテンツ管理システムは、自動分類、ルーティング、保持ポリシーにXMPを利用しています。

仕組み

XMP metadataは、PDFにメタデータストリームオブジェクトとして保存され、通常は文書カタログ辞書から/Metadataキーを使用して参照されます。ストリームには、XMPパケットの開始と終了を示す<?xpacket?>処理命令でラップされたUTF-8エンコードのXMLデータが含まれます。XML構造は、プロパティをスキーマに整理するために名前空間付き要素を使用したRDF/XML構文を使用します。

典型的なXMPパケットには、複数の名前空間宣言(Dublin Core用のxmlns:dcやXMP Basic用のxmlns:xmpなど)の後に、<rdf:Description>ブロックを含む<rdf:RDF>ルート要素が続きます。各descriptionブロックは、<dc:title><xmp:CreateDate>のような修飾名を使用して関連プロパティをグループ化します。プロパティは、単純なテキスト値、言語代替(多言語コンテンツ用)、順序付き配列、または順序なしの値の集合にできます。

プログラムでPDFを作成または変更する際、開発者はXMPライブラリを使用して有効なメタデータパケットを生成するか、XML構造を直接構築できます。XMPデータは下位互換性のために文書情報辞書の対応するエントリと同期する必要がありますが、両方が存在する場合はXMPが優先されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。メタデータストリームは通常、テキストベースの検索と編集を容易にするために非圧縮またはFlateDecode圧縮を使用します。

関連用語

  • Document information dictionary – PDFトレーラー内の単純なキー・バリューペアを使用する従来のメタデータ構造
  • Metadata stream – XMPまたは他のメタデータ形式を含むPDFストリームオブジェクト
  • Tagged PDF – 論理的な文書構造とアクセシビリティ情報を含むPDF構造
  • PDF catalog – メタデータストリームを参照するPDF文書のルートオブジェクト
  • RDF(Resource Description Framework) – XMP metadataを構造化するために使用されるXMLベースのフレームワーク

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html