Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDNumberTreeNode

PDNumberTreeNodeは、Apache PDFBox PDModel APIのクラスで、PDF仕様で定義されている数値ツリーノード構造を表現します。

キーワード: pdnumbertreenode, PDNumberTreeNode

概要

PDNumberTreeNodeは、Apache PDFBox PDModel APIのクラスで、PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている数値ツリーノード構造を表現します。数値ツリーは、PDF文書内で整数キーとPDFオブジェクトの関連付けを効率的に保存および取得するために使用される特殊なデータ構造です。このクラスは、Java開発者に対して、ページラベル、構造要素、Tagged PDFの親ツリーなどで一般的に使用される数値ツリー構造をプログラムで読み取り、変更、およびナビゲートするためのメソッドを提供します。

定義

PDNumberTreeNodeは、Apache PDFBoxにおける高レベルラッパークラスで、PDF数値ツリーノードの低レベルCOS(Carousel Object Structure)表現をカプセル化します。PDFの数値ツリーは名前ツリーに似ていますが、文字列の代わりに整数をキーとして使用します。ツリー構造は、「Limits」と「Kids」エントリを含む中間ノードと、「Limits」と「Nums」エントリを含むリーフノードで構成されます。PDNumberTreeNodeクラスは、これらの実装の詳細を抽象化し、Tagged PDF ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) のParentTreeエントリなどの構造を扱うための開発者に優しいインターフェースを提供します。ParentTreeは、構造階層内で構造要素識別子をその親要素にマッピングします。

単純な辞書や配列とは異なり、数値ツリーはソートされたキー順序を維持し、特に数千のエントリを含む大規模な文書を扱う際に重要な、効率的な検索操作のためのバランスツリー構造を使用します。PDNumberTreeNodeは、文字列キーではなく整数キーを処理する点でPDNameTreeNodeとは異なり、数値インデックスが必要なシナリオに適しています。

重要性

アクセシブルなPDFおよび文書構造を扱う開発者にとって、PDNumberTreeNodeはTagged PDF文書 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) をプログラムで作成または変更する際に不可欠です。数値ツリー構造を使用するParentTreeは、Tagged PDFアーキテクチャの重要なコンポーネントであり、支援技術が文書構造を効率的にナビゲートすることを可能にします。適切な数値ツリーの実装がなければ、Tagged PDFはアクセシビリティ検証に失敗したり、スクリーンリーダーなどの支援技術による処理時にパフォーマンスが低下したりする可能性があります。

PDNumberTreeNodeの理解は、PDF生成ツール、アクセシビリティ修復ソフトウェア、または構造要素マッピングを維持または作成する必要がある文書処理パイプラインを構築する際に特に重要です。数値ツリーの不適切な操作は、文書構造の破損、アクセシビリティ機能の破壊、またはPDF/UA準拠チェックに失敗する文書を引き起こす可能性があります。

仕組み

PDNumberTreeNodeは、各ノードが中間ノードまたはリーフノードのいずれかであるツリーデータ構造上で動作します。中間ノードは「Kids」配列を通じて子ノードへの参照を含み、リーフノードは「Nums」配列内に実際のキーと値のマッピングを含みます。各ノードの「Limits」配列は、そのノードのサブツリー内に含まれる最小および最大のキー値を指定し、効率的な二分探索操作を可能にします。

Apache PDFBoxでPDNumberTreeNodeを使用する際、開発者は通常、基礎となるツリーナビゲーションを抽象化するメソッドとやり取りします。このクラスは、整数キーによる値の取得、エントリの反復処理、新しいキーと値のペアの追加を行うメソッドを提供します。APIは、ノードが ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で指定された推奨サイズ制限を超えた場合、ツリーのバランシングと分割を自動的に処理します。

Tagged PDFの場合、ParentTreeは構造ツリールートを通じてアクセスされ、PDNumberTreeNodeを使用して実装されます。文書のコンテンツストリーム内の各マークされたコンテンツ識別子(MCID)は、ParentTree内の整数キーに対応し、関連する値は親構造要素を指します。このマッピングにより、コンテンツから構造への効率的な逆引き検索が可能になり、支援技術のナビゲーションとコンテンツ抽出操作に不可欠です。

関連用語

  • PDNameTreeNode – PDFオブジェクトと名前を関連付けるために整数キーの代わりに文字列キーを使用する類似のツリー構造クラス
  • PDStructureTreeRoot – ParentTreeを含む数値ツリーへの参照を含むPDF論理構造ツリーのルート
  • PDPageLabels – PDF文書内でカスタムページ番号付けスキームを定義するために数値ツリーを使用する構造
  • COSDictionary – PDNumberTreeNodeの基礎となるPDF辞書オブジェクトを表現する低レベルPDFBoxクラス
  • Tagged PDF – 構造要素マッピングとアクセシビリティサポートのために数値ツリーを広範に使用する論理構造情報を持つPDF文書

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html