Metadata navigation
メタデータナビゲーションとは、PDFファイル内のドキュメントメタデータにアクセスし、トラバースするための構造化されたアプローチを指します。
メタデータナビゲーションとは、PDFファイル内のドキュメントメタデータにアクセスし、トラバースするための構造化されたアプローチを指します。PDF開発において、メタデータはドキュメントのコンテンツ、構造、およびプロパティに関する説明的な情報を提供し、自動化システムと支援技術の両方がドキュメントを効果的に理解し、ナビゲートすることを可能にします ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この機能は、アクセシビリティ標準に準拠したアクセシブルなPDFを作成する上で特に重要です ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。
メタデータナビゲーションとは、開発者がPDFドキュメントに埋め込まれたメタデータにアクセス、読み取り、活用することで、ドキュメントの発見、コンテンツの理解、およびナビゲーションを促進するプログラム的なメカニズムです。単純なテキスト検索や視覚的なナビゲーションとは異なり、メタデータナビゲーションは、XMP(Extensible Metadata Platform)データ、ドキュメント情報ディクショナリ、Tagged PDF要素内の構造的メタデータなど、ドキュメントのメタデータストリームに格納された構造化情報を活用します ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。
この概念は、可視コンテンツそのものではなく、ドキュメントに関する記述的および構造的な情報に焦点を当てている点で、コンテンツナビゲーションとは異なります。コンテンツナビゲーションがテキスト、ページ、視覚要素を移動するのに対し、メタデータナビゲーションは、ドキュメントのタイトル、著者、作成日、言語仕様、コンテンツがどのように整理されているかを記述する構造的階層などの情報にアクセスします。
PDF処理アプリケーションを構築する開発者にとって、メタデータナビゲーションは以下のような重要な機能において不可欠です。
アクセシビリティ準拠: アプリケーションは、支援技術にドキュメントを正しく提示するためにメタデータをナビゲートする必要があり、これにより障害を持つユーザーがドキュメント構造とコンテンツの組織を理解できるようになります ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。
検索と発見: メタデータナビゲーションにより、ドキュメントのインデックス作成、検索機能、およびコンテンツ管理システムが効率的に動作し、全文解析を必要とせずにPDFをそのプロパティに基づいて分類・検索できます。
自動処理: バッチ処理、ドキュメント検証、またはコンテンツ抽出を含むワークフローは、ドキュメント全体の内容を解析することなく、ドキュメントのタイプ、バージョン、構造的特性を識別するためにメタデータナビゲーションに依存しています。
クロスプラットフォーム互換性: メタデータを適切にナビゲートし、活用することで、異なるPDFリーダーやプラットフォーム間でドキュメントが一貫して動作し、意図された機能と構造が維持されます。
メタデータナビゲーションは、PDF文書構造内の複数のレイヤーを通じて動作します。
Document Information Dictionary(文書情報ディクショナリ): 開発者は、ドキュメントのInfo dictionaryを通じて基本的なメタデータにアクセスします。これには、Title、Author、Subject、Keywords、Creator、Producer、CreationDate、ModDateなどの標準エントリが含まれます。これらのキーと値のペアは、PDFライブラリAPIを通じてアクセス可能な基本的なドキュメントプロパティを提供します。
XMP Metadata Streams(XMPメタデータストリーム): より包括的なメタデータはXMPストリームに存在し、RDF(Resource Description Framework)を使用してXML形式で構造化情報を格納します。ナビゲーションには、これらのストリームを解析してDublin Core要素、PDF固有のプロパティ、カスタムメタデータスキーマを抽出することが含まれます。
Structure Tree Navigation(構造ツリーナビゲーション): Tagged PDFでは、メタデータナビゲーションには、ロールマッピング、属性オブジェクト、およびコンテンツの組織を記述する階層関係を含む構造ツリーのトラバースが含まれます ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。この構造的メタデータにより、支援技術が論理的な読み順序と意味的な意味を提示できるようになります。
Marked Content(マークされたコンテンツ): 開発者は、構造的および意味的な情報でコンテンツストリームをタグ付けし、可視コンテンツをそのメタデータ表現に接続するマークされたコンテンツシーケンスをナビゲートします。
実装は通常、メタデータエントリを列挙し、特定のプロパティをクエリし、構造的階層をプログラム的にトラバースするメソッドを提供するPDFライブラリを使用して行われ、アプリケーションがドキュメントの処理と提示について十分な情報に基づいた判断を行えるようにします。
- Tagged PDF – コンテンツの階層と意味的な意味を定義する構造的メタデータを持つPDFドキュメント
- Document Information Dictionary – 基本的なメタデータのキーと値のペアを含む標準的なPDFオブジェクト
- XMP Metadata – PDFドキュメントにリッチなメタデータを埋め込むためのExtensible Metadata Platform形式
- Structure Tree – Tagged PDFにおける論理的なドキュメント構造の階層的表現
- Accessibility API – ドキュメントメタデータを支援技術に公開するプログラミングインターフェース
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
