PDMarkInfo
PDMarkInfoは、Apache PDFBox PDModel APIのJavaクラスであり、PDF文書内のMarkInfo辞書を表現します。
PDMarkInfoは、Apache PDFBox PDModel APIのJavaクラスであり、PDF文書内のMarkInfo辞書を表現します。この辞書は、文書が ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されたTagged PDF規約に準拠しているかどうかを示します。PDMarkInfoクラスは、PDFがアクセシビリティやコンテンツの再利用に必要な構造情報を含んでいるかを示すマーキングプロパティを照会および設定するためのメソッドを提供します。
PDMarkInfoは、PDF文書のカタログ辞書内のMarkInfoエントリに対応し、文書の論理構造特性を記述するブール値フラグを含みます。主要なフラグである「Marked」は、文書がPDF仕様標準に従って構造要素でタグ付けされているかどうかを示します。表示コンテンツやメタデータを扱う他のPDFBoxクラスとは異なり、PDMarkInfoは、 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で参照されているTagged PDF文書に必要な構造適合性宣言を管理します。このクラスは、文書に疑わしい構造ツリー要素が含まれているかどうか、またはすべての注釈とフォームフィールドが構造ツリーに適切に組み込まれているかどうかなど、アクセシビリティに関連する重要なフラグを読み書きするためのプログラマティックなインターフェースとして機能します。
アクセシブルなPDF文書を扱う開発者にとって、PDMarkInfoは、PDFがアクセシビリティ準拠のために適切にタグ付けされているかどうかを判断するために不可欠です。PDF/UA ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの規格に準拠した文書を作成または検証する際、MarkInfo辞書の確認は自動検証ワークフローの最初のステップであることがよくあります。これらのフラグを正しく設定することで、支援技術が文書構造を適切に解釈でき、PDFプロセッサが文書内に存在する構造マークアップを期待し、尊重するようになります。MarkInfoを適切に構成しないと、アクセシビリティ検証ツールが適切に構造化された文書を拒否したり、さらに悪いことに、支援技術が有効な構造情報を無視したりする可能性があります。
PDMarkInfoクラスは、MarkInfo辞書で定義されているブール値フラグのgetterメソッドとsetterメソッドを提供します。最も重要なメソッドであるisMarked()は、文書が
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
の規約に従ってタグ付けされていると主張しているかどうかを返します。開発者は通常、pdDocument.getDocumentCatalog().getMarkInfo()のようなコードを使用して、文書カタログを通じてPDMarkInfoにアクセスします。Tagged PDFを作成する際、開発者は新しいPDMarkInfoオブジェクトをインスタンス化し、setMarked(true)を呼び出し、それを文書カタログに添付する必要があります。areSuspects()などの追加メソッドは、構造ツリーに不正確または不完全なタグ付けが含まれている可能性があるかどうかを示し、areAnnotationsMarked()とareFormsMarked()は、これらの要素が論理構造に適切に組み込まれているかどうかを示します。これらのフラグは、PDFプロセッサに対して、文書内で期待される構造機能についての宣言として機能します。
- Tagged PDF – タグを使用してコンテンツ階層とセマンティクスを定義する論理構造情報を含むPDF文書
- PDStructureElement – PDFの論理構造ツリー内の個々の構造要素を表すApache PDFBoxクラス
- PDDocumentCatalog – MarkInfo辞書を含む他の文書レベルプロパティの中で、PDF文書のルートオブジェクト
- PDF/UA – 適切なタグ付けとMarkInfo構成を必要とするアクセシブルなPDF文書のISO規格
- Structure Tree – PDFの論理的な読み順序とセマンティック関係を定義するタグ付きコンテンツ要素の階層組織
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
