Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

不可視テキスト(Invisible text)

不可視テキストとは、PDF文書の構造内に存在し、選択、検索、支援技術による読み取りが可能でありながら、視覚的には晴眼者に対して表示されないテキストレイヤーを指します。

キーワード: invisible text, 不可視テキスト

概要

不可視テキストとは、PDF文書の構造内に存在し、選択、検索、支援技術による読み取りが可能でありながら、視覚的には晴眼者に対して表示されないテキストレイヤーを指します。この技術は、光学文字認識(OCR)を通じてスキャンした文書に検索可能なテキストを追加する際に最も一般的に使用され、認識されたテキストは不透明度をゼロにするか、知覚不可能にするレンダリングモードで文書画像に重ねられます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )Tagged PDFにおいて、不可視テキストは、元の文書の視覚的外観を維持しながら、文書コンテンツをスクリーンリーダーが適切に抽出して読み上げられるようにすることで、アクセシビリティにおいて重要な役割を果たします ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

定義

不可視テキストは、文字データがPDFコンテンツストリーム内に存在しながらも、特定のレンダリングパラメータによって視覚的に知覚不可能にされるテキストレンダリング技術です。レイヤーの可視性やクリッピング操作によって完全に表示から除外される隠しコンテンツとは異なり、不可視テキストはページのコンテンツ構造の一部として残り、テキスト抽出アルゴリズム、検索機能、支援技術からアクセス可能です。

不可視性は通常、いくつかの方法のいずれかによって実現されます:テキストレンダリングモードを不可視(モード3)に設定する、テキストの色を背景と完全に一致させる、または不透明度(アルファ)値をゼロに設定する、などです。不可視であるにもかかわらず、このテキストはPDF座標系内での位置座標を維持しており、ユーザーが文書内のテキストが存在する領域をクリックしてドラッグすることで選択できます。

不可視テキストは、実際の注釈や代替テキスト記述とは異なり、補足的なメタデータではなく文書の主要コンテンツを表現します。また、白い背景上の白いテキスト(特定の表示条件下では技術的に可視)とも異なります。真の不可視テキストは、背景色や表示設定に関係なく知覚不可能性を保証するレンダリングモードを使用するためです。

重要性

文書アクセシビリティとPDF生成に携わる開発者にとって、不可視テキストを理解することは、いくつかの実用的な理由から不可欠です。第一に、これはスキャンした文書を視覚障害を持つユーザーにアクセシブルにするための主要なメカニズムです。スクリーンリーダーは、他のテキスト表現が存在しない場合、このテキストレイヤーに依存して文書コンテンツを音声化します ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

第二に、不可視テキストは文書管理システムやPDFビューアの検索機能に直接影響を与えます。適切に実装された不可視テキストレイヤーにより、画像ベースの文書全体での全文検索が可能になり、文書の発見性と使いやすさが大幅に向上します。文書処理パイプラインを構築する開発者は、OCRで生成された不可視テキストが視覚的コンテンツを正確に表現し、検索の信頼性を維持することを保証する必要があります。

第三に、PDF/UA準拠では、スキャンした文書における不可視テキストレイヤーの適切な実装がしばしば要求されます。アクセシブルなPDF生成ワークフローを開発する際、開発者は不可視テキストが正しく配置され、適切なUnicode文字を使用し、文書のタグ付き構造内で論理的な読み順序を維持していることを検証する必要があります ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。不適切な実装は、アクセシビリティ違反、準拠チェックの失敗、またはスクリーンリーダーユーザーにとって断片的な読み取り体験をもたらす可能性があります。

仕組み

技術的なレベルでは、不可視テキストはPDFコンテンツストリーム内のテキスト状態パラメータを操作することで作成されます。最も一般的なアプローチは、テキストレンダリングモード演算子(Tr)を使用する方法で、これは0から7までの整数値を受け入れます。これをモード3に設定すると、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているテキスト抽出および選択プロセスに含めることを可能にしながら、テキストを不可視にします。

典型的な実装では、不可視テキストをスキャンした画像の直上に配置します。OCRプロセスが各単語または文字の座標と寸法を決定し、次にPDF座標空間内で一致する位置を持つテキストオブジェクトを作成します。テキストはモード3を使用してレンダリングされ、基礎となる画像を覆い隠すことなく、アクセシビリティと検索目的のために利用可能であることが保証されます。テキストのフォント、サイズ、スペーシングは、正確な選択動作と適切なテキスト抽出を維持するために、画像内の文字の視覚的外観と密接に一致する必要があります。

Tagged PDFの場合、不可視テキストは文書の論理構造ツリーに適切に組み込まれる必要があります。テキストコンテンツは、支援技術が文書を正しくナビゲートできるようにするために、適切な構造要素(段落、見出し、リスト項目など)内でマークされる必要があります ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )ActualText属性も不可視テキストと組み合わせて使用され、OCR出力にエラーが含まれている場合や、視覚的表現が意図された意味的意味と異なる場合に、訂正または明確化されたコンテンツを提供することができます。

位置精度は不可視テキスト実装において重要です。不可視テキストレイヤーが視覚的コンテンツと位置ずれしている場合、ユーザーはハイライトされたテキストが画面に表示されているものと一致しない混乱する選択動作を経験する可能性があります。開発者は、特に大量の文書バッチを処理する際に、不可視テキストと対応する画像コンテンツ間の位置合わせを検証する品質管理チェックを実装する必要があります。

関連用語

  • Tagged PDF – 文書の階層とコンテンツ関係を定義する意味的マークアップを含むPDF構造。支援技術による不可視テキストの適切な解釈に不可欠
  • OCR(Optical Character Recognition、光学文字認識) – スキャンした画像を分析し、視覚的文字を機械可読テキストに変換することで、不可視テキストレイヤーを生成するプロセス
  • Text Extraction(テキスト抽出) – PDF文書からテキストコンテンツを取得するプロセス。画像ベースの文書では不可視テキストレイヤーに依存する
  • PDF/UA – スキャンしたコンテンツにおける不可視テキストの適切な実装要件を定義する、アクセシブルなPDF文書のためのISO規格
  • Text Rendering Mode(テキストレンダリングモード) – 検索可能なテキストレイヤーに使用される不可視モードを含む、テキストの表示方法を制御するPDF演算子

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html