PDAnnotationTextMarkup
PDAnnotationTextMarkupは、Apache PDFBoxライブラリにおいて、PDFドキュメント内のテキストマークアップ注釈を表現するJavaクラスです。
PDAnnotationTextMarkupは、Apache PDFBoxライブラリにおいて、PDFドキュメント内のテキストマークアップ注釈を表現するJavaクラスです。これらの注釈により、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、ユーザーは基礎となるテキスト自体を変更することなく、テキストコンテンツをハイライト、下線、取り消し線、または波線下線で装飾できます。このクラスは、これらの視覚的なマークアップ要素をプログラム的に作成、読み取り、変更するためのメソッドを提供します。テキストマークアップ注釈は、アクセシビリティ機能やドキュメントレビューワークフローにおいて特に重要です。
PDAnnotationTextMarkupは、Apache PDFBoxのPDModel API内の具体的な実装クラスであり、PDF仕様 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているテキストマークアップ注釈を処理します。このクラスはPDAnnotation基底クラスを拡張し、Highlight(ハイライト)、Underline(下線)、StrikeOut(取り消し線)、Squiggly(波線)という4つのテキストマークアップサブタイプを管理します。実際のコンテンツストリームを変更するテキスト編集操作とは異なり、テキストマークアップ注釈は元のコンテンツを保持したまま、既存のテキスト上に視覚的なインジケーターを重ねます。このクラスは、テキスト領域上にマークアップを正確に配置するために必要な複雑な座標系と四辺形定義をカプセル化しており、 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているアクセシビリティコンプライアンスにおいて特に重要です。
PDAnnotationTextMarkupは、PDAnnotationFreeTextやPDAnnotationInkなどの他の注釈タイプとは異なり、新しいコンテンツや自由形式の描画を追加するのではなく、既存のテキストコンテンツを特に対象とします。また、注釈はで説明されている基礎となるドキュメント構造に影響を与えることなく、有効化、無効化、または削除できる別レイヤーに存在するため、コンテンツ変更操作とも異なります。
PDFドキュメントを扱う開発者にとって、PDAnnotationTextMarkupは、ドキュメントレビュー、コラボレーション、アクセシビリティ機能を実装するための必須機能を提供します。多くのビジネスワークフローは、元のコンテンツを変更せずにドキュメントをマークアップする機能に依存しています。法的レビュー、編集プロセス、教育的フィードバックシステムは、すべてこの機能に依存しています。このクラスにより、開発者はAdobe AcrobatなどのPDFリーダーアプリケーションで作成された注釈と同一に見えるマークアップをプログラム的に作成できます。
アクセシビリティの観点から、テキストマークアップ注釈は、スクリーンリーダーや支援技術が正しく解釈できるように適切に構造化される必要があり、これはPDF/UAコンプライアンス ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) にとって重要です。ドキュメントアクセシビリティ機能を実装する開発者は、マークアップされたコンテンツがアクセス可能な状態を維持するために、PDAnnotationTextMarkupを必要とします。さらに、テキストマークアップ注釈をプログラム的に抽出・分析する機能により、レビュー済みドキュメントの処理、フィードバックの集約、ドキュメントリビジョン全体での変更追跡などの自動化ワークフローが可能になります。
PDAnnotationTextMarkupは、マークアップされるテキスト領域を正確に輪郭描写する四辺形座標を定義することで動作します。各注釈には、QuadPoints配列が含まれています。これは、マークされたテキストをカバーする各四辺形の4つの角を定義する8つの座標のセットです。これらの座標はPDFユーザー空間単位で指定され、複数行にまたがるテキストや異なるフォントとサイズを使用するテキストを考慮する必要があります。
PDFBoxを使用してテキストマークアップ注釈を作成する際、開発者はPDAnnotationTextMarkupオブジェクトをインスタンス化し、サブタイプ(Highlight、Underline、StrikeOut、またはSquiggly)を指定し、マークアップ領域を定義する四辺形ポイントを提供します。このクラスは、Javaオブジェクトと ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている基礎となるPDF辞書構造との間の変換を処理します。開発者は、色、不透明度、注釈の外観特性などの視覚的プロパティも設定できます。
このクラスは、必須のQuadPoints配列と、Contents(ポップアップテキスト)、CreationDate、ModificationDateなどのオプションプロパティを含む、すべての注釈プロパティのgetterおよびsetterメソッドを提供します。PDFから既存の注釈を読み取る際、PDAnnotationTextMarkupはPDF辞書エントリを解析し、Java APIを通じて公開することで、開発者が既存のマークアップをクエリ、変更、または削除できるようにします。注釈の視覚的な外観は、サブタイプと色プロパティに従ってPDFビューアによってレンダリングされ、ハイライトは半透明の色付き矩形として、下線はテキストベースライン下の線として表示されます。
Tagged PDF構造 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) との適切な統合のため、テキストマークアップ注釈は、ドキュメントの論理構造ツリーを通じて適切なコンテンツを参照する必要があり、支援技術がマークアップを対応するテキストコンテンツに関連付けられるようにします。
- PDAnnotation – Apache PDFBoxにおけるすべてのPDF注釈の基底クラスで、共通のプロパティとメソッドを提供
- PDPage – 注釈が添付されるPDFドキュメント内の単一ページを表す
- PDAnnotationHighlight – テキストをハイライトするために使用されるテキストマークアップ注釈の特定サブタイプ
- PDRectangle – PDF座標空間内の矩形領域を定義し、注釈の配置に使用される
- Tagged PDF – アクセシビリティとテキストマークアップの関連付けを可能にする論理構造を持つPDFドキュメント
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
