PDPageLabels
PDPageLabelsは、Apache PDFBox PDModel APIの高レベルクラスで、PDF文書内のページラベル情報へのプログラマティックなアクセスを提供します。
PDPageLabelsは、Apache PDFBox PDModel APIの高レベルクラスで、PDF文書内のページラベル情報へのプログラマティックなアクセスを提供します。ページラベルは、PDF閲覧ソフトでページ番号がどのように表示されるかを制御し、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているページラベル辞書に従って、文書の異なるセクションに異なる番号スタイル(ローマ数字、アルファベット、カスタムプレフィックス)を使用できるようにします。このクラスにより、開発者は既存のページラベル設定を読み取ったり、単純な連番を超えた洗練されたページ番号スキームを作成するために変更したりすることができます。
PDPageLabelsは、Apache PDFBoxのorg.apache.pdfmodelパッケージ内のJavaクラスで、PDFのページラベル辞書構造のラッパーとして機能します。常に0から始まり順次増加する物理的なページインデックスとは異なり、ページラベルはPDF閲覧ソフトでユーザーに表示される論理的なページ識別子を定義します。例えば、前付けには「i, ii, iii」を使用し、本文には「1, 2, 3」を使用するといった形です。このクラスは、特定のページのラベル情報を取得したり、新しいラベル範囲を追加したり、これらの定義を格納する基盤となるNumberTreeNode構造を操作したりするメソッドを提供します。PDPageLabelsは個々のページオブジェクトを表すPDPageクラスとは異なり、PDF全体でのすべてのページの表示と参照方法に影響を与える文書レベルのメタデータを管理します。
ページラベリングは、前付け(序文、目次)に伝統的に小文字のローマ数字を使用し、本文にアラビア数字を使用するという印刷出版の慣習に合致した、プロフェッショナルな文書を作成するために不可欠です。文書生成、結合、操作を行う開発者にとって、PDPageLabelsは、異なる番号スキームを持つ文書を結合する場合や、異なる番号スタイルを持つ複数のセクションを含む文書を作成する場合に、適切なページ参照を維持するために必要な制御を提供します。これは ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 準拠文書のアクセシビリティとナビゲーション機能において特に重要になります。正確なページラベリングは、ユーザーが大きな文書を効率的にナビゲートするのに役立ちます。適切なページラベル管理がなければ、結合またはプログラム的に生成されたPDFは、文書の構造と一致しない混乱した、または不正確なページ番号を表示する可能性があります。
PDPageLabelsクラスは、PDF文書カタログのPageLabelsエントリと相互作用します。これは、ページインデックスをラベル辞書にマッピングするために数値ツリー構造を使用します。各ラベル辞書は、番号スタイル(/Sキー、値は/Dで10進数、/rで小文字ローマ数字、/Rで大文字ローマ数字、/Aで大文字アルファベットなど)、プレフィックス文字列(/Pキー)、開始値(/Stキー)を指定できます。PDPageLabelsを使用する際、開発者は通常、この数値ツリーにアクセスするメソッドを使用して現在のラベリングスキームを取得し、特定のラベリングルールを持つ新しい範囲を定義することで変更します。例えば、開発者はページ0-4に「Preface-」というプレフィックス付きの小文字ローマ数字を使用し、ページ5以降は1から始まる10進数の番号を使用するように設定できます。このクラスは、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で指定されている数値ツリー構造の基盤となる複雑さを処理し、開発者が低レベルのPDFオブジェクトを直接管理するのではなく、直感的な範囲ベースの概念で作業できるようにします。
- PDDocument – ページラベル辞書を含むPDF文書全体を表すApache PDFBoxのトップレベルクラス
- PDPage – PDF文書構造内の個々のページオブジェクトを表すクラス
- PDDocumentCatalog – PageLabelsエントリとその他の文書レベルのメタデータを含む文書カタログオブジェクト
- Number Tree – ページラベル範囲を含む順序付きキー・バリューの関連付けを効率的に格納するために使用されるPDFデータ構造
- Page Index – 文書内のページの0ベースの物理的位置で、表示されるラベルとは異なる
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
