PDXFAResource
PDXFAResourceは、Apache PDFBoxの標準APIクラスではありません。
PDXFAResourceは、Apache PDFBoxの標準APIクラスではありません。この用語は、PDFリソースとXFA(XML Forms Architecture)を混同しているように見えますが、これらはPDF仕様
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
において別個の概念です。Apache PDFBoxは、PDFページリソースを管理するPDResourcesクラスやPDFフォームを扱うPDAcroFormクラスを提供していますが、標準APIでは「PDXFAResource」というクラス名は使用されていません。
PDF開発において、リソースとXFAフォームは別々の構造要素です。PDFリソース(PDFBoxのPDResourcesクラスで処理される)は、レンダリング時にページが参照するフォント、画像、グラフィックステートなどの再利用可能なオブジェクトを定義します。一方、XFAフォームは、PDF 2.0で非推奨となったXMLベースのフォーム技術を表します
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。Apache PDFBoxのPDModel APIは、これらの目的に対して個別のクラスを提供しています。PDResourcesはリソース辞書を管理し、PDPageはページ構造を管理し、PDAcroFormはインタラクティブフォーム(AcroForms)を処理します。PDFBoxライブラリには標準の「PDXFAResource」クラスは存在しませんが、開発者はカスタム実装や、これらの別個の概念間の混同に遭遇する可能性があります。
PDF操作を行う開発者にとって、正しいPDFBox APIクラスを理解することは不可欠です。フォントや画像を管理するためのPDResourcesや、フォーム処理のためのPDAcroFormなど、適切なクラスを使用することで、コードの互換性、保守性、PDF標準への準拠が保証されます。クラス名を誤認したり混同したりすると、実装エラー、ドキュメント検索の困難、PDFアクセシビリティ要件
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
に関する問題につながる可能性があります。PDFBox APIの適切な使用は、PDFが異なるビューアでどのようにレンダリングされるか、また準拠基準を満たすかどうかにも影響します。
Apache PDFBoxのPDModel APIは、特化したクラスを通じてPDF構造の操作を整理します。PDDocumentクラスはエントリーポイントとして機能し、個々のページを表すPDPageオブジェクトへのアクセスを提供します。各PDPageには、フォント(PDFont)、画像(PDImageXObject)、グラフィックステートを含むリソース辞書を管理するPDResourcesオブジェクトが含まれています。インタラクティブフォームについては、PDAcroFormがフォームフィールドへのアクセスと変更のためのメソッドを提供し、PDAnnotationクラスがコメント、マークアップ、ウィジェット注釈を処理します。アクセシビリティのための文書構造
(
Citation: PDF Association, 2023
PDF Association(2023). Retrieved from
https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
)
を扱う場合、開発者はPDStructureElementおよびPDStructureTreeRootクラスを使用します。これらのクラスは、基盤となるPDFファイル構造から読み書きするgetterおよびsetterメソッドを通じて連携し、生のPDF構文の複雑さをJavaオブジェクトに抽象化します。
- PDResources – PDFページが参照するフォント、画像、グラフィックステートを含むリソース辞書を管理するApache PDFBoxクラス
- PDAcroForm – PDF仕様で定義されているインタラクティブPDFフォーム(AcroForms)を扱うためのApache PDFBoxクラス
- PDModel – PDF文書構造へのオブジェクト指向アクセスを提供する、Apache PDFBoxの高レベルAPIレイヤー
- XFA(XML Forms Architecture) – PDF 2.0で非推奨となったXMLベースのフォーム技術で、標準のAcroFormsとは異なる
- Tagged PDF – アクセシビリティとコンテンツリフローを可能にする論理構造情報を持つPDF文書
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
