Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDF viewer highlighting

PDFビューアハイライト機能とは、PDF レンダリングアプリケーションが表示中のPDFドキュメント内の特定のコンテンツ領域、テキスト選択範囲、または注釈を視覚的に強調表示する機能を指します。

キーワード: pdf viewer highlighting, PDF viewer highlighting

概要

PDFビューアハイライト機能とは、PDF レンダリングアプリケーションが表示中のPDFドキュメント内の特定のコンテンツ領域、テキスト選択範囲、または注釈を視覚的に強調表示する機能を指します。この機能により、ユーザーは重要な箇所をマークしたり、レビューコメントを作成したり、検索結果の可視化を実装したりできます。PDFビューアにおけるハイライト処理は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているドキュメント構造を正しく解釈する必要があり、テキスト抽出と座標マッピングを適切に処理して、正確な視覚表現を確保しなければなりません。

定義

PDFビューアハイライト機能は、特定の領域に注意を引くために、PDFコンテンツ上に色付きのオーバーレイや背景領域を描画するレンダリング機能です。PDFファイル自体に埋め込まれる静的なハイライト注釈とは異なり、ビューアハイライトは通常、動的でセッションベースの視覚的強調を指し、ドキュメントに永続化される場合とされない場合があります。実装には、意図したコンテンツ上にハイライト領域を正確に配置するため、テキスト境界、グリフ位置、座標変換の精密な計算が必要です。

これは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている特定の注釈サブタイプであるPDFハイライト注釈とは異なります。ハイライト注釈はPDF構造に保存される永続的なマークアップオブジェクトです。ビューアハイライトは多くの場合一時的で、検索結果のハイライトやテキスト選択のフィードバックなど、ビューアアプリケーションのユーザーインターフェースによって制御されます。ただし、ビューアはPDFに保存された永続的なハイライト注釈もレンダリングする場合があり、その場合は注釈のアピアランスストリームのサポートとページコンテンツとの適切なレイヤー処理が必要になります。

重要性

PDFビューアやドキュメント管理システムを構築する開発者にとって、堅牢なハイライト機能の実装は、ユーザーエクスペリエンスとアクセシビリティにとって不可欠です。ユーザーは、ドキュメントを検索して結果が即座にハイライト表示されること、視覚的なフィードバックを伴うテキスト選択、意図したコンテンツを正確にカバーするレビューマークアップの作成を期待しています。ハイライト実装が不十分だと、オーバーレイの位置ずれ、テキスト選択境界の誤認識、スクリーンリーダーがマークされたコンテンツを適切に解釈できないなどのアクセシビリティ問題が発生する可能性があります。

ハイライト機能は、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で規定されているTagged PDFやアクセシブルなドキュメントを扱う際に特に重要になります。論理構造を適切にトラバースして、ハイライトされたコンテンツが読み順序と意味的な境界を尊重するようにする必要があります。開発者は、複雑なテキストレイアウト、右から左への言語、縦書きモード、マルチカラム形式などを考慮し、多様なドキュメントタイプでハイライトが正しく表示されるようにしなければなりません。

仕組み

PDFビューアハイライト機能は、いくつかの連携したステップで動作します。まず、ビューアはPDFページのコンテンツストリームからテキストコンテンツと位置情報を抽出し、テキスト表示演算子を解析し、現在の変換マトリックスを追跡してグリフ座標を決定する必要があります。検索ハイライトを実装する場合、ビューアは抽出されたコンテンツに対してテキストマッチングを実行し、一致した領域の境界矩形を計算します。

インタラクティブなテキスト選択ハイライトの場合、ビューアはマウス座標をPDFユーザー空間座標に変換し、テキストオブジェクトに対してヒットテストを実行し、複数の行や列にまたがる可能性のある選択境界を計算します。ハイライトのレンダリングは通常、ページコンテンツの上層だが注釈の下層に半透明の色付き矩形を描画し、ビューアのグラフィックスシステムを使用してハイライトを下層のPDFレンダリングと合成することで行われます。

( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で説明されているTagged PDFを扱う場合、ハイライトシステムは意味的な正確性を確保するために論理構造ツリーを尊重する必要があります。これは、純粋に視覚的な位置ではなく、タグ付けされたコンテンツ階層に従うことを意味し、アクセシビリティ機能や適切なコンテンツ抽出にとって特に重要です。ビューアは、回転したテキスト、クリップされたコンテンツ、ハイライト可能なテキストを含むForm XObjectsなどのエッジケースも処理する必要があります。

関連用語

  • Text extraction(テキスト抽出) – 検索および選択操作のためにPDFページから読み取り可能なテキストコンテンツと位置情報を取得するプロセス
  • Annotation(注釈) – PDFドキュメントに埋め込まれるマークアップオブジェクトで、ハイライト、下線、その他の視覚的強調タイプを含む
  • Content stream(コンテンツストリーム) – テキスト表示コマンドを含む、ページコンテンツの視覚的外観を定義するPDF演算子のシーケンス
  • Tagged PDF – アクセシビリティのためにコンテンツの関係性と読み順序を定義する論理マークアップを含むPDFドキュメント構造
  • Coordinate transformation(座標変換) – PDFレンダリングにおける異なる座標空間間のマッピングを行う数学的操作で、正確なヒットテストとハイライト配置に不可欠

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html