Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDF metadata API reference

PDF metadata APIリファレンスは、PDFドキュメントに埋め込まれたメタデータの読み取り、書き込み、変更を行うためのプログラマティックインターフェースを提供します。

キーワード: pdf metadata api reference, PDF metadata API reference

概要

PDF metadata APIリファレンスは、PDFドキュメントに埋め込まれたメタデータの読み取り、書き込み、変更を行うためのプログラマティックインターフェースを提供します。PDFメタデータには、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているタイトル、作成者、サブジェクト、キーワード、作成日、変更日などのドキュメントプロパティが含まれます。これらのAPIにより、開発者はレガシーなドキュメント情報辞書と最新のXMP(Extensible Metadata Platform)メタデータストリームの両方を管理できます。Metadata APIは、ドキュメント管理システム、アクセシビリティの実装、自動化されたPDF処理ワークフローに不可欠です。

定義

PDF metadata APIリファレンスは、開発者がPDFファイルに保存されたメタデータとやり取りするためのプログラミングインターフェースを文書化したものです。PDFドキュメントには、2つの主要なメタデータ保存メカニズムがあります:ドキュメント情報辞書(シンプルなキー・バリューペアを使用するレガシー構造)とXMPメタデータストリーム(XMLベースの拡張可能なメタデータ形式)です。APIリファレンスは通常、メタデータ値の抽出、既存プロパティの更新、カスタムメタデータフィールドの追加、2つのメタデータ形式間の同期を行うメソッドをカバーしています。ページストリーム内のテキストや画像に焦点を当てるコンテンツ抽出APIとは異なり、metadata APIは可視コンテンツの外に存在するドキュメントレベルの記述情報を特に対象としています。これらのAPIは、静的なドキュメントプロパティではなくインタラクティブな要素を扱うフォームフィールドAPIやアノテーションAPIとは異なります。

重要性

Metadata APIは、ドキュメント管理ソリューション、デジタルアセット管理システム、アクセシビリティ準拠アプリケーションを構築する開発者にとって重要です。適切なメタデータ管理により、エンタープライズコンテンツ管理システムにおける検索機能、ドキュメント分類、権利管理、監査証跡が可能になります。アクセシビリティアプリケーションでは、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で強調されているように、メタデータが支援技術に必要な重要なドキュメント構造情報を提供します。開発者はこれらのAPIを使用して、作成者情報の一括更新、ドキュメントコレクション全体への一貫したメタデータスキーマの適用、インデックス作成のためのドキュメントプロパティの抽出など、ドキュメント処理ワークフローを自動化します。信頼性の高いmetadata APIがなければ、開発者はPDFの内部構造を直接解析する必要がありますが、これは複雑で、エラーが発生しやすく、バージョンに依存します。

仕組み

PDF metadata APIは通常、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された標準メタデータプロパティ(Title、Author、Subject、Keywords、Creator、Producer、CreationDate、ModDateを含む)のゲッターおよびセッターメソッドを提供します。メタデータを読み取る際、APIはドキュメントの情報辞書(ドキュメントカタログ内に存在)にアクセスし、XMPメタデータストリームが存在する場合はそれを解析します。メタデータの書き込みには、情報辞書エントリの更新と、オプションでメタデータストリームとして保存されるXMPメタデータパケットの作成または変更が含まれます。最新の実装のほとんどは、両方の形式間の同期を維持し、古いPDFリーダーとの互換性を確保しながら、拡張可能なメタデータ要件をサポートします。高度なAPIは、カスタムメタデータスキーマ、XMPプロパティの名前空間管理、特定の標準に対するメタデータ検証をサポートします。APIは通常、エンコーディングの問題や日付形式の変換を処理し、メタデータの変更がドキュメントの変更日を適切に更新することを保証します。一部の実装では、ファイル全体をメモリにロードせずに大規模なドキュメントコレクションを処理するためのストリーミング機能を提供します。

関連用語

  • Document Information Dictionary – PDFファイル内のレガシーなキー・バリュー型メタデータ構造
  • XMP Metadata – リッチなドキュメントプロパティのためのXMLベースの拡張可能なメタデータプラットフォーム
  • PDF Document Catalog – メタデータとドキュメント構造への参照を含むルートオブジェクト
  • PDF/UA – 支援技術のための特定のメタデータを要求するアクセシビリティ標準
  • Tagged PDF – ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で詳述されている論理的なドキュメント構造を記述するメタデータを含む構造化PDF形式

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html