Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

非テキストコンテンツ(Non-text content)

非テキストコンテンツとは、PDF文書内の視覚的または図形的な要素のうち、実際のテキスト文字として表現されていないものを指します。

キーワード: non-text content, 非テキストコンテンツ

概要

非テキストコンテンツとは、PDF文書内の視覚的または図形的な要素のうち、実際のテキスト文字として表現されていないものを指します。これにはラスター画像、ベクターグラフィックス、アイコン、装飾要素などが含まれます。アクセシブルなPDFの文脈では、非テキストコンテンツは適切にタグ付けされ、代替テキストによる説明が提供される必要があります。これにより、スクリーンリーダーやその他の支援技術が、障害を持つユーザーに対して意味のある情報を伝えることができるようになります ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。これはアクセシビリティ標準を満たすPDF/UA準拠文書を作成するための基本的な要件です ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

定義

非テキストコンテンツは、PDF内の視覚的要素のうち、選択可能で読み取り可能なテキスト文字としてエンコードされていないものすべてを含みます。これには写真、イラスト、図表、グラフ、アイコン、ロゴ、装飾的な境界線、そしてテキスト表示演算子ではなく描画操作を使用して作成されたベクターグラフィックスが含まれます。重要な区別は、非テキストコンテンツは追加のメタデータなしではスクリーンリーダーが直接読み取ったり、意味のあるテキストとして抽出したりできないということです。

Tagged PDF構造では、非テキストコンテンツは通常<Figure>タグまたは類似の構造要素でマークされます。PDF仕様では、意味のある非テキストコンテンツ(文書を理解するために必要な情報を伝えるもの)と装飾的な非テキストコンテンツ(美的な目的のみに使用されるもの)を区別しています。この区別は重要です。なぜなら、意味のあるコンテンツには代替テキストによる説明が必要ですが、純粋に装飾的なコンテンツは支援技術によって無視されるようにアーティファクトとしてマークされるべきだからです ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

重要性

PDF文書を作成または処理する開発者にとって、非テキストコンテンツを適切に処理することは、法的コンプライアンスとユーザーアクセシビリティのために不可欠です。多くの法域では、デジタル文書がWCAG 2.0やPDF/UA-1などのアクセシビリティ標準を満たすことを要求しており、これらの標準は意味のある画像やグラフィックスに代替テキストを付けることを義務付けています。適切な代替説明を提供しないと、視覚障害を持つユーザーを排除するアクセシブルでない文書になる可能性があります。

技術的な観点から、非テキストコンテンツを理解することは、PDF生成ライブラリ、文書変換ワークフロー、またはアクセシビリティ修正ツールを実装する際に極めて重要です。開発者は非テキストコンテンツをプログラム的に識別し、それが意味のあるものか装飾的なものかを判断し、適切な代替テキストを付加するか、またはアーティファクトとしてマークする必要があります。これにはPDFのタグ付け構造を扱い、文書の構造ツリー内でAltActualTextなどの属性を適切に設定する方法を理解することが必要です ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

仕組み

PDF構造ツリーでは、非テキストコンテンツは通常<Figure><Formula>、またはカスタムタグなどの構造要素内に含まれます。このコンテンツをアクセシブルにするため、開発者は構造要素の属性辞書のAltエントリを使用して代替テキストによる説明を提供します。例えば、四半期ごとの売上データを示すグラフには、「第1四半期の5万ドルから第4四半期の8万5千ドルへと増加する四半期売上を示す棒グラフ」といったテキスト説明を含むAltエントリが設定されます。

PDF仕様ではActualText属性も提供されており、これは非テキストコンテンツが文字通り読まれるべき特定のテキストを表す場合(例えば、会社名を含むロゴの画像など)に使用できます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。スクリーンリーダーがタグ付けされた非テキストコンテンツに遭遇すると、生のグラフィックコンテンツを解釈しようとするのではなく、Altテキスト(またはActualTextが存在する場合はそれ)を読み上げます。

情報的な目的を持たない装飾的な非テキストコンテンツについては、開発者はコンテンツを構造ツリーに含めるのではなく、アーティファクトとしてマークする必要があります。これは、Artifactタグを使用してマークされたコンテンツシーケンス内にコンテンツ演算子を囲むことで行われます。アーティファクトは支援技術によって完全に無視され、読み上げフローの不要な中断を防ぎます。代替テキストを必要とする意味のあるコンテンツと、アーティファクトとしてマークされる装飾的なコンテンツの区別は、PDF/UA準拠の基本です ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

関連用語

  • Tagged PDF – 読み順序と要素の関係を定義する論理構造ツリーを持つPDF文書
  • 代替テキスト(Alternative text – 支援技術のユーザーに意味を伝えるために非テキストコンテンツに提供されるテキスト説明
  • アーティファクト(Artifact – 文書の意味に無関係な装飾的なコンテンツとしてマークされ、支援技術によって無視されるもの
  • 構造要素(Structure element – コンテンツの論理構造と意味的な意味を定義するTagged PDFの要素
  • PDF/UA – 非テキストコンテンツの取り扱いに関する要件を定義する、アクセシブルなPDF文書のためのISO標準

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html