本文(Main content)
本文(Main content)とは、PDFドキュメントの本質的な意味と目的をユーザーに伝える、主要な情報伝達要素を指します。
本文(Main content)とは、PDFドキュメントの本質的な意味と目的をユーザーに伝える、主要な情報伝達要素を指します。タグ付きPDF構造において、本文は装飾要素、繰り返しのナビゲーション、またはドキュメントの中核メッセージに貢献しないその他のアーティファクトと区別されます ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。本文を適切に識別しタグ付けすることは、アクセシビリティにとって不可欠です。これにより、支援技術が障害を持つユーザーに最も重要な情報を提示できるようになります ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。
本文は、ドキュメントの目的を理解するために必要な実質的な情報を含むすべてのドキュメント要素を包含します。これには、本文テキスト、見出し、データテーブル、代替テキスト付きの情報画像、グラフ、およびドキュメントの主要なメッセージを伝えるその他の要素が含まれます。本文は、PDF仕様で定義された構造要素を使用してマークアップされます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。
本文はアーティファクトとは異なります。アーティファクトとは、ページヘッダー、フッター、透かし、装飾的な枠線、背景画像など、視覚的な外観を強化するがコンテンツの意味には貢献しない表現要素です。本文は論理構造ツリーに含まれ、適切にタグ付けされる必要がありますが、アーティファクトは支援技術によって無視されるように明示的にマークされます。
この区別は繰り返しコンテンツにも及びます。ナビゲーションメニューや繰り返しのヘッダーには意味のあるテキストが含まれている場合がありますが、ユーザーがドキュメントの中核情報により効率的にナビゲートできるよう、主要コンテンツ領域と区別されることがよくあります。
PDF生成システムやアクセシビリティ修正ツールを構築する開発者にとって、本文を正しく識別することは以下の理由から重要です。
アクセシビリティ準拠: PDF/UA標準では、すべての意味のあるコンテンツが適切にタグ付けされ、論理的な読み上げ順序に含まれる必要があり、意味のないアーティファクトはそのようにマークされる必要があります ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。本文をアーティファクトとして誤って分類すると、スクリーンリーダーユーザーにとって情報がアクセス不可能になります。
スクリーンリーダーナビゲーション: 支援技術のユーザーは、ドキュメントを効率的にナビゲートするために適切なコンテンツ識別に依存しています。本文が正しくタグ付けされている場合、スクリーンリーダーは繰り返し要素をスキップし、論理的な順序で重要な情報を提示できます。
コンテンツ抽出とリフロー: 適切にタグ付けされた本文により、検索インデックス作成、コンテンツ再利用、および異なる画面サイズへのリフローのための信頼性の高いテキスト抽出が可能になります。これは、モバイルデバイスのアクセシビリティやコンテンツ管理システムにとってますます重要になっています。
法的および規制要件: 多くの法域では、デジタルドキュメントがアクセシビリティ基準を満たすことを要求しています。コンテンツの分類が不適切だと、Section 508、EN 301 549、または欧州アクセシビリティ法などの規制への非準拠につながる可能性があります。
PDF構造階層において、本文はそのセマンティックな役割を説明する標準構造タイプを使用して整理されます。構造ツリーには、本文を構成する段落(<P>)、見出し(<H1>から<H6>)、リスト(<L>、<LI>)、テーブル(<Table>)、図(<Figure>)などの要素が含まれます
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
各本文要素は以下のように処理されます。
構造ツリーに含まれる: 本文要素は、ドキュメントの論理構造内の構造要素の子要素であり、読み上げ順序の一部であることを保証します。
適切な構造タイプでタグ付けされる: 要素は、見た目だけでなく機能(見出し、段落、リスト項目など)を説明するセマンティックタグを使用します ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。
コンテンツストリームと関連付けられる: タグ付けされたコンテンツは、マークされたコンテンツシーケンスを通じて、PDFコンテンツストリーム内の実際のテキスト、グラフィックス、または画像にリンクされます。
論理的に順序付けられる: 本文は構造ツリー内に読み上げられるべき順序で表示されます。これは、ページ上の視覚的な表示順序とは異なる場合があります。
対照的に、アーティファクトとしてマークされた要素は、構造ツリーから完全に除外されます。アーティファクトは、コンテンツストリーム内の/Artifactタグを使用してマークされたコンテンツとして指定され、支援技術に対してこのコンテンツをナビゲーションと読み上げ中に無視すべきであることを示します。
PDF生成を実装する開発者は、要素がドキュメントの意味に貢献するかどうかに基づいて、各要素を本文(適切な構造タグ付き)またはアーティファクトとして正しく分類するコードを確保する必要があります。
- Artifact – 支援技術によって無視されるように明示的にマークされた装飾的または非本質的なページ要素
- Structure tree(構造ツリー)– コンテンツの論理的な読み上げ順序を定義するタグ付きコンテンツ要素の階層構造
- Tagged PDF – コンテンツの論理的な構成を定義する構造タグを含むPDFドキュメント
- Reading order(読み上げ順序)– 特に支援技術を使用するユーザーに対して、コンテンツが提示されるべき順序
- Marked content(マークされたコンテンツ)– 構造ツリーにリンクするタグでラップされたPDFコンテンツストリーム
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
