コンテンツ順(描画順)
コンテンツ順(Content order)は、描画順(paint order)とも呼ばれ、PDFのコンテンツストリーム内でグラフィカルオブジェクトやテキストがレンダリングされる順序を指します。
コンテンツ順(Content order)は、描画順(paint order)とも呼ばれ、PDFのコンテンツストリーム内でグラフィカルオブジェクトやテキストがレンダリングされる順序を指します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この物理的なレンダリング順序は、支援技術がTagged PDFを解釈する際に従う論理的な読み上げ順序とは異なります ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。PDF/UAなどの標準に準拠したアクセシブルなPDF文書を作成するには、コンテンツ順と読み上げ順の違いを理解することが不可欠です。
コンテンツ順は、PDFページのコンテンツストリームに描画操作が出現する低レベルの順序です。PDFレンダラーがページを処理する際、これらの操作を出現順に正確に実行し、テキスト、グラフィック、画像をページのキャンバスに描画します。この順序は、PDF作成ソフトウェアがコンテンツストリームに操作を書き込む方法によって決定され、情報の論理構造ではなく、文書構築の機械的なプロセスを反映します。
対照的に、読み上げ順序(reading order)は、Tagged PDFの構造ツリーで定義される論理的な順序であり、スクリーンリーダーなどの支援技術のユーザーにコンテンツをどのように提示すべきかを指定します ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。視覚的なレイアウト要件と論理的な情報の流れが常に一致するとは限らないため、コンテンツ順と読み上げ順序は頻繁に異なります。例えば、視覚的なレイヤリングの目的でサイドバーをメインコンテンツより先に描画する場合がありますが、読み上げ順序ではスクリーンリーダーを最初にメインコンテンツに誘導する必要があります。
PDFを作成または処理する開発者にとって、コンテンツ順を理解することはいくつかの理由で重要です。第一に、アクセシブルなPDFを生成する際、コンテンツを描画する順序がアクセシビリティ準拠に必要な読み上げ順序と一致すると仮定することはできません ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。開発者は、コンテンツストリームの順序に依存するのではなく、構造ツリーと読み上げ順序を明示的に定義する必要があります。
第二に、既存のPDFをアクセシビリティ対応にリメディエーションする際、コンテンツ順と読み上げ順序が一致していない文書に遭遇することがよくあります。これらの不一致を特定するには、コンテンツストリームの順序と構造ツリーの階層の両方を分析できるツールが必要です。第三に、パフォーマンスの考慮事項がコンテンツ順の決定に影響を与える可能性があります(類似の操作を最適化のためにグループ化するなど)。これにより、文書構造内で別の正しい読み上げ順序を維持することがさらに重要になります。
PDFのコンテンツストリームは、グラフィカル操作を記述する演算子とオペランドの連続です。これらの操作は最初から最後まで順次実行され、各操作は順番にページキャンバスに描画されます。例えば、コンテンツストリームには次のような内容が含まれる場合があります:
- ヘッダーのテキスト配置と描画演算子
- 装飾線のパス構築とストローク演算子
- 本文コンテンツのテキスト演算子
- イラストの画像配置演算子
この機械的な順序が、何が最初、2番目というように描画されるかを決定し、コンテンツ順を確立します。しかし、Tagged PDFには、コンテンツアイテムを論理構造要素にマッピングする別の構造ツリーが含まれています ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。この構造ツリーは、段落、見出し、リスト、テーブルなどの要素に階層的なツリーとしてコンテンツを整理することで読み上げ順序を定義します。
構造ツリーは、マークされたコンテンツシーケンス(MC)またはオブジェクト参照を通じてコンテンツアイテムを参照し、論理構造と描画されたコンテンツ間の関連付けを作成します。単一の構造要素は、連続していない複数のマークされたコンテンツシーケンスを参照できるため、読み上げ順序は異なる順序で描画されたコンテンツを再構成できます。この関心事の分離により、PDFは最適なレンダリングパフォーマンスとアクセシビリティのための適切な論理構造の両方を維持できます。
- Reading order(読み上げ順序) – 特に支援技術のために、コンテンツがユーザーに提示されるべき論理的な順序
- Tagged PDF – 構造ツリーを通じて構造情報を含むPDFで、アクセシビリティ機能を可能にする
- Structure tree(構造ツリー) – 文書構成を定義する論理構造要素の階層的な組織
- Marked content(マークされたコンテンツ) – レンダリングを論理構造に接続するために構造情報でタグ付けされたコンテンツストリームのセクション
- Content stream(コンテンツストリーム) – ページ上でコンテンツがどのようにレンダリングされるかを定義するPDF演算子の連続
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
