Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

標準構造名前空間(Standard structure namespace)

標準構造名前空間は、PDF内で事前定義された名前空間であり、Tagged PDF内の構造要素に対する標準的なタグ名とその意味的な意味を定義します。

キーワード: standard structure namespace, 標準構造名前空間

概要

標準構造名前空間は、PDF内で事前定義された名前空間であり、Tagged PDF内の構造要素に対する標準的なタグ名とその意味的な意味を定義します ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。段落、見出し、表、リストなどの構造タイプの共通語彙を提供し、支援技術やその他のPDF処理アプリケーションが文書構造を一貫して理解できるようにします。この名前空間は、PDF/UA ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準に準拠したアクセシブルなPDF文書を作成するための基盤となります。

定義

標準構造名前空間は、名前空間URI http://iso.org/pdf/ssn(PDF 2.0の場合)で識別されるか、名前空間宣言がない場合に暗黙的に使用されます(PDF 1.xの場合)。この名前空間には、PDF仕様で定義された標準化された構造タイプが含まれており、基本的なテキスト要素(P、H1-H6、Span)、グループ化要素(Div、Sect、Art)、リスト要素(L、LI、Lbl、LBody)、表要素(Table、TR、TH、TD)、その他の特殊なタイプが含まれます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

カスタムまたはロールマッピングされた構造タイプとは異なり、標準構造タイプは明確に定義された意味を持ち、準拠するPDFプロセッサによって普遍的に認識されます。開発者は特殊なコンテンツ用にカスタム名前空間を作成できますが、標準構造名前空間は基本的なアクセシビリティと相互運用性を保証する基盤を提供します ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

標準名前空間とロールマッピングの違いは、ロールマッピングが非標準のタグ名を標準タイプにマッピングできるのに対し、標準名前空間は適切な解釈のためにすべてが最終的にマッピングされる必要がある権威あるタイプのセットを定義する点にあります。

重要性

PDF文書を作成または処理する開発者にとって、標準構造名前空間の理解は以下の理由から不可欠です:

アクセシビリティ準拠: PDF/UAは、すべての構造要素が標準構造タイプを使用するか、標準タイプにロールマッピングされることを要求しており、この名前空間の知識はアクセシブルな文書を作成する上で重要です ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

相互運用性: 標準構造タイプを使用することで、スクリーンリーダー、リフローエンジン、コンテンツ抽出ツール、その他のPDFプロセッサが、異なるプラットフォームやベンダー間でPDFを正しく解釈できるようになります。

検証とテスト: アクセシビリティ検証ツールは、構造要素が標準タイプを適切に使用またはマッピングしているかを確認するため、この名前空間を理解することで、開発中のタグ付けの問題を診断し修正できます。

コンテンツ抽出: PDFから構造化されたコンテンツを抽出するアプリケーションは、見出し、段落、データ表などの意味的なコンポーネントを正確に識別するために標準構造タイプに依存しています。

仕組み

標準構造名前空間は、それぞれ定義された役割と許可された関係を持つ構造タイプの階層システムを通じて動作します。PDFプロセッサは構造要素に遭遇すると、要素のタグ名(および指定されている場合は名前空間)を調べて、その意味的な意味を判断します ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

標準名前空間の構造タイプカテゴリには以下が含まれます:

  • グループ化要素: Document、Part、Art、Sect、Divはコンテンツを階層的に整理します
  • ブロックレベル要素: P(段落)、H1-H6(見出し)、BlockQuoteはテキストブロックを表します
  • インライン要素: Span、Quote、Note、Reference、Codeはブロック内のコンテンツをマークします
  • リスト構造: L(リスト)、LI(リスト項目)、Lbl(ラベル)、LBody(リスト項目本体)
  • 表構造: Table、TR(行)、TH(ヘッダーセル)、TD(データセル)、THead、TBody、TFoot
  • 図解要素: Figure、Formula、Formは非テキストコンテンツ
  • 特殊構造: TOC、TOCI、Index、Bibliography、Caption

各構造タイプは、親子関係についての制約を定義しています。例えば、TR要素はTable、THead、TBody、またはTFoot要素の子である必要があり、TDおよびTH要素はTR要素の子である必要があります ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

Tagged PDFをプログラムで作成する際、開発者は構造要素ディクショナリの/Sエントリを使用して構造タイプを指定します。PDF 2.0で標準名前空間を使用する場合、/NSエントリは標準構造名前空間ディクショナリを参照する必要がありますが、デフォルトの名前空間を使用する場合は省略することもできます。

関連用語

  • 構造要素(Structure element) – 標準名前空間のタイプを使用するTagged PDF構造ツリーの基本的な構成要素
  • ロールマッピング(Role mapping) – カスタム構造タイプを標準構造タイプにマッピングして意味的な等価性を持たせるメカニズム
  • 名前空間(Namespace) – 関連する構造タイプをグループ化し、その意味を定義するコンテナ
  • 構造タイプ(Structure type) – 構造要素の意味的な分類(例:段落、見出し、表)
  • PDF/UA – 標準構造タイプの適切な使用を要求するアクセシビリティ標準

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html