Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

ロールマッピング(Role mapping)

ロールマッピング(Role mapping)は、Tagged PDFにおいて、ドキュメント作成者がカスタム構造タグとPDF仕様で定義された標準構造タイプとの関係を定義できるメカニズムです。

キーワード: role mapping, ロールマッピング

概要

ロールマッピング(Role mapping)は、Tagged PDFにおいて、ドキュメント作成者がカスタム構造タグとPDF仕様で定義された標準構造タイプとの関係を定義できるメカニズムです。これらのマッピングを確立することで、支援技術やその他のPDFプロセッサが非標準タグの意味を解釈できるようになり、カスタムドキュメント構造のアクセシビリティと機械可読性が維持されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この機能により、PDF/UAなどのアクセシビリティ標準との互換性を維持しながら、柔軟なドキュメント作成が可能になります ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

定義

ロールマッピングは、PDFの構造ツリー内の辞書ベースのシステムで、カスタムタグ名と標準構造タイプを明示的に関連付けます。ドキュメント作成者が「H1」や「Span」のような標準タグではなく、「Heading1」や「ProductName」などのカスタムタグを使用する場合、ロールマップはそのカスタムタグを同等の標準構造タイプにマッピングすることで、PDFプロセッサがそのカスタムタグをどう解釈すべきかを指示します。

ロールマップは、構造ツリールート辞書のRoleMapエントリに格納されます。この辞書の各キーはカスタムタグ名であり、対応する値は標準構造タイプ、または最終的にマッピングのチェーンを通じて標準タイプに解決される別のカスタム名です。名前空間ベースのアプローチとは異なり、ロールマッピングはドキュメントレベルで動作し、ドキュメント全体の特定のカスタムタグのすべてのインスタンスにグローバルに適用されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

ロールマッピングは、標準タグの直接使用とは異なり、間接的なレイヤーを追加することで、オーサリングシステムが独自のタグ語彙を維持しながらアクセシブルな出力を生成できるようにします。また、タグタイプにグローバルに適用されるロールマッピングは、特定の構造要素に適用されるクラスマッピングとも異なります。

重要性

PDF生成システムやドキュメント処理ツールを構築する開発者にとって、ロールマッピングは以下のいくつかの重要な理由から不可欠です。

アクセシビリティコンプライアンス: PDF/UAでは、すべての構造要素が標準構造タイプを使用するか、ロールマッピングを通じてそれらにマッピングされることが要求されます ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。適切なロールマッピングがなければ、支援技術はドキュメント構造を確実に解釈できず、障害のあるユーザーにとってコンテンツがアクセシブルでなくなります。

コンテンツオーサリングの柔軟性: ロールマッピングにより、組織は自社のコンテンツモデルやオーサリングワークフローに合わせたカスタムタグセットを維持しながら、出力が標準準拠であることを保証できます。これは、ドメイン固有の要素名を使用する他の構造化フォーマット(XMLやHTMLなど)から変換する場合に特に有用です。

相互運用性: カスタムタグを標準タイプにマッピングすることで、開発者は各ツールがすべての可能なカスタムタグ名を理解する必要なく、異なるPDFリーダー、スクリーンリーダー、アクセシビリティチェッカー間でPDFが正しく動作することを保証できます。

将来性の確保: PDF仕様の新しいバージョンが追加の標準構造タイプを導入する際、ロールマッピングにより、ドキュメント全体を再タグ付けするのではなく、マッピングを変更することでドキュメントを更新できます。

仕組み

ロールマッピングメカニズムは、PDFファイル内の辞書構造を通じて動作します。技術的な動作は以下の通りです。

位置と構造: RoleMap辞書は構造ツリールートに配置され、ドキュメントカタログのStructTreeRootエントリを通じてアクセスされます。RoleMapの各エントリは、キー(カスタムタグ名)と値(マッピング先の標準構造タイプ)で構成されます ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

マッピング解決: PDFプロセッサがカスタムタグを持つ構造要素に遭遇すると、RoleMapを参照して対応する標準タイプを見つけます。マッピングされた値自体がカスタムタグである場合、プロセッサは認識された標準構造タイプに到達するまでチェーンを通じて解決を続けます。無限ループを防ぐために循環参照は避けなければなりません。

標準構造タイプ: PDF仕様では、グループ化要素(Document、Part、Sect)、ブロックレベル要素(P、H1-H6、Table)、インラインレベル要素(Span、Quote、Link)、図要素(Figure、Formula)などのカテゴリに分類された標準構造タイプのセットが定義されています。カスタムタグは、意味的に最も適切な標準タイプにマッピングする必要があります。

適用範囲: ロールマッピングは、ドキュメント全体のカスタムタグのすべてのインスタンスに適用されます。個々の構造要素は、要素の辞書を通じてそのロールをオーバーライドできますが、グローバルなRoleMapはデフォルトの解釈を提供します。

マッピング構文の例: PDFの内部構造では、ロールマップは次のように表示される場合があります。

/RoleMap << /Heading1 /H1 /Heading2 /H2 /Para /P /Emphasis /Span >>

このマッピングは、PDFプロセッサに「Heading1」を「H1」、「Heading2」を「H2」、「Para」を「P」(段落)、「Emphasis」を「Span」(汎用インライン要素)として扱うよう指示します。

関連用語

  • 標準構造タイプ(Standard structure types) – 一般的なドキュメント要素を定義する、PDF標準で指定された事前定義されたタグタイプのセット
  • 構造ツリー(Structure tree – タグ付きコンテンツを含む、PDFドキュメントの論理構造を階層的に表現したもの
  • Tagged PDF – コンテンツの論理的な読み順と意味を定義する構造情報を含むPDF
  • PDF/UA – 適切な構造とロールマッピングを要求する、アクセシブルなPDFドキュメントのISO標準
  • 名前空間(Namespace) – 単一のドキュメント内で複数の構造タイプ語彙を共存させることを可能にするPDF 2.0の機能

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html