Structure tree

キーワード: structure tree, Structure tree

概要

Structure treeは、PDFドキュメントの論理構造を階層的に表現したもので、コンテンツの意味的な意味合いと読み上げ順序を記述する構造要素のツリーとして構成されています。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) これはTagged PDF文書の基幹となり、支援技術が障害を持つユーザーに対してコンテンツを意味のある形で提示することを可能にします。Structure treeは、コンテンツの視覚的な表現を論理的な構成にマッピングすることで、開発者がアクセシブルで適切に構造化されたドキュメントを作成できるようにします。

定義

Structure treeは、ドキュメントカタログのStructTreeRootエントリに格納されているstructure tree root（構造ツリールート）をルートとし、親子階層で構成された構造要素を含むツリー構造のデータ構造です。 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) ツリー内の各構造要素は、PDF仕様で定義された標準化された構造タイプを使用して、段落、見出し、リスト、表、図などのドキュメントの論理的な構成要素を表現します。

Structure treeは、ページツリー（ページの視覚的な表示順序を定義）やコンテンツストリーム（実際の描画命令を含む）とは異なります。コンテンツストリームが要素がページ上でどのように視覚的に表示されるかに焦点を当てているのに対し、structure treeはそれらの要素が意味的に何を意味し、論理的にどのように関連しているかに焦点を当てています。この分離により、同じ視覚的コンテンツが構造的なコンテキストに基づいて異なる解釈をされることが可能になります。

重要性

PDFドキュメントを作成または処理する開発者にとって、structure treeはいくつかの重要なユースケースにおいて不可欠です：

アクセシビリティのコンプライアンス: Structure treeはPDF/UA（Universal Accessibility）準拠に必須であり、スクリーンリーダーやその他の支援技術がドキュメントコンテンツを正しくナビゲートおよび解釈することを可能にします。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 適切なstructure treeがないと、視覚障害のあるユーザーはドキュメントコンテンツに意味のある形でアクセスできません。

コンテンツの抽出: PDFからテキストやデータを抽出する際、structure treeは正しい読み上げ順序と意味的なコンテキストを提供し、マルチカラムレイアウトからのテキストの混乱や表データの誤解釈といった一般的な抽出エラーを防ぎます。

ドキュメントのリフローと再利用: Structure treeにより、コンテンツを異なる画面サイズに合わせてリフローしたり、他の形式（HTML、EPUBなど）に変換したりする際に、視覚的なレイアウトだけでなく論理的なドキュメント構造を保持することができます。

検索性とインデックス化: 検索エンジンやドキュメント管理システムは、structure treeを使用してドキュメントコンテンツをより適切に理解し、検索精度を向上させ、セマンティック検索を可能にします。

仕組み

Structure treeは、ドキュメントカタログの/StructTreeRootエントリから参照されるstructure tree root辞書から始まります。このルートは、1つ以上の構造要素を子として含み、それぞれが構造要素辞書として表現されます。

構造要素のプロパティ: 各構造要素には、構造タイプ（段落の/P、レベル1見出しの/H1、表の/Tableなど）、追加の意味情報を提供するオプションの属性、および他の構造要素との親子関係が含まれます。要素は他の構造要素を含むことができ（例：複数の/P段落を含む/Sectセクション）、またはPDFページ上の実際のコンテンツを参照するマークされたコンテンツを含むことができます。

コンテンツのマッピング: Structure treeは、マークされたコンテンツシーケンスを通じて実際のページコンテンツに接続されます。これらは、一意の識別子（MCID）でタグ付けされたコンテンツストリームのセクションです。構造要素はこれらのマークされたコンテンツシーケンスを参照し、論理構造と視覚的コンテンツの間のリンクを作成します。このマッピングにより、同じコンテンツがページ上の視覚的な位置とドキュメント階層内の論理的な位置の両方を持つことができます。

標準構造タイプ: PDF仕様では、カテゴリごとに編成された標準構造タイプを定義しています：グループ化要素（セクション、区分）、ブロックレベル要素（段落、見出し、リスト）、インラインレベル要素（スパン、引用）、および図要素（図、数式）。開発者は、カスタム構造タイプを標準タイプにマッピングするロールマッピングを通じて、互換性を保ちながらカスタム構造タイプを作成することもできます。

走査と処理: アプリケーションは、親子関係に従って深さ優先順序でstructure treeを走査し、論理的な読み上げ順序を決定します。この走査はページ上の物理的なレイアウトとは独立しており、複数のページからのコンテンツを正しい順序で読み取ることができます。

出典

(N.A.) (2020): (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023): PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014): (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html

概要

定義

重要性

仕組み

関連用語

出典