PDPage
PDPageは、Apache PDFBoxの高レベルPDModel APIにおけるコアクラスで、PDF文書内の単一ページを表現します。
PDPageは、Apache PDFBoxの高レベルPDModel APIにおけるコアクラスで、PDF文書内の単一ページを表現します。このクラスは、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているページレベルの構造体(ページサイズ、コンテンツストリーム、リソース、注釈、メタデータなど)にアクセスし操作するためのメソッドを開発者に提供します。PDFBoxベースのJavaアプリケーションにおいて、プログラムによるページレベル操作を行うための主要なインターフェースとして機能します。
PDPageは、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDFページディクショナリの機能をカプセル化したJavaクラスです。Cos(Carousel Object Structure)オブジェクトを直接操作する低レベルのPDF操作アプローチとは異なり、PDPageは一般的なページ操作を簡素化するオブジェクト指向の抽象化レイヤーを提供します。このクラスは、PDFの内部構造の複雑さを処理しながら、ページプロパティの読み取り、コンテンツの変更、注釈の管理、フォームフィールドへのアクセスを行うための直感的なメソッドを公開します。PDPageインスタンスは通常、PDDocumentオブジェクトから取得され、読み込まれたPDFファイルの既存ページと、文書生成のために新規作成されたページの両方を表現できます。
JavaでPDF文書を扱う開発者にとって、PDPageはページレベルのPDF操作の複雑さを大幅に軽減するため不可欠です。この高レベルAPIがなければ、開発者はPDFの内部オブジェクト構造を手動でナビゲートし、間接オブジェクト参照を管理し、PDF仕様の厳密な構文要件への準拠を保証する必要があります。PDPageはこれらの低レベルの詳細を自動的に処理するため、開発者はPDFの内部構造ではなくアプリケーションロジックに集中できます。これは特に、 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準に準拠したアクセシブルなPDFを扱う際に重要になります。適切なページ構造とリソース管理は、支援技術の互換性にとって不可欠だからです。
PDPageは、PDFページディクショナリオブジェクトのラッパーとして動作し、内部的に基礎となるCosオブジェクトを管理するgetterおよびsetterメソッドを提供します。開発者がgetMediaBox()やgetResources()などのメソッドを呼び出すと、PDPageはページディクショナリから対応するエントリを取得し、それらを適切なJavaオブジェクトに変換します。コンテンツ操作のために、PDPageはページの描画命令が存在するコンテンツストリームへのアクセスを提供し、ページで使用されるフォント、画像、その他のアセットを参照するページのリソースディクショナリを管理します。このクラスはまた、ページツリーのナビゲーションを処理し、文書の階層的なページ構造を通じた走査を可能にします。
(
Citation: PDF Association, 2023
PDF Association(2023). Retrieved from
https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
)
で説明されているTagged PDFコンテンツを扱う際、PDPageは構造要素にアクセスし、アクセシブルな文書に必要な論理的な読み上げ順序を維持するための基盤を提供します。
- PDDocument – PDFBoxでPDF文書全体を表現するルートコンテナクラス
- PDPageContentStream – PDPageにコンテンツ(テキスト、グラフィック、画像)を書き込むために使用されるクラス
- PDResources – ページに関連付けられたリソースディクショナリを表し、フォント、画像、その他のアセットを含む
- PDAnnotation – ページに添付されたコメント、リンク、フォームフィールドなどのインタラクティブ要素を表現
- MediaBox – PDFにおけるページの物理的またはデジタル的なサイズを定義する境界
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
