Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

BeginMarkedContentSequence

BeginMarkedContentSequenceは、PDFコンテンツストリーム内のBMC(Begin Marked Content)オペレーターを表現するApache PDFBox APIのクラスです。

キーワード: beginmarkedcontentsequence, BeginMarkedContentSequence

概要

BeginMarkedContentSequenceは、PDFコンテンツストリーム内のBMC(Begin Marked Content)オペレーターを表現するApache PDFBox APIのクラスです。このオペレーターは、PDFドキュメント内でマークされたコンテンツシーケンスを開始するもので、アクセシビリティと論理的なドキュメント構造をサポートする構造化されたタグ付きPDFを作成するために不可欠です ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このクラスは、PDFファイルを生成または操作する際に、プログラムでマークされたコンテンツの境界を挿入するためのJavaインターフェースを提供します。

定義

BeginMarkedContentSequenceは、PDF仕様で定義されているBMCオペレーターをカプセル化するApache PDFBoxの具象実装クラスです。PDFコンテンツストリームにおいて、BMCオペレーターは関連するタグ名を持つマークされたコンテンツシーケンスの開始を示し、コンテンツを論理的にグループ化して識別できるようにします。これは、BDC(Begin Marked Content with Property Dictionary)オペレーターとは異なり、BDCもマークされたコンテンツを開始しますが、追加のプロパティ情報を含みます。BeginMarkedContentSequenceクラスは、プロパティを含まないよりシンプルなBMCケースを特に処理するため、タグ識別子のみが必要な基本的なコンテンツ構造化シナリオに適しています ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

重要性

PDFアクセシビリティとドキュメント構造を扱う開発者にとって、BeginMarkedContentSequenceは、アクセシビリティ標準を満たす準拠したPDF/UAドキュメントを作成するために重要です ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。このクラスを使用することで、タグ付きPDFコンテンツをプログラムで作成できるようになり、これはスクリーンリーダーや支援技術がドキュメント構造を適切に解釈するために不可欠です。PDF生成システムを構築する際、BeginMarkedContentSequenceの適切な使用方法を理解することで、ドキュメントが論理的な読み順序、意味的な意味を維持し、規制上のアクセシビリティ要件を満たすことを保証できます。これは、大規模にアクセシブルなドキュメントを生成する必要があるエンタープライズアプリケーションにおいて特に重要になります。

仕組み

Apache PDFBoxで使用する場合、BeginMarkedContentSequenceは通常、インスタンス化され、PDPageContentStreamクラスを介してコンテンツストリームに追加されます。このオペレーターは、マークされるコンテンツのタイプを識別するタグ名パラメーター(段落の場合は「P」、画像の場合は「Figure」など)を必要とします。マークされたコンテンツシーケンスは、対応するEMC(End Marked Content)オペレーターが検出されるまで、コンテンツストリーム内でアクティブな状態を維持します。タグ付きPDFワークフローでは、これらのマークされたコンテンツシーケンスは、ドキュメントの構造ツリーに対する並列構造を作成し、ページ上の視覚的なコンテンツを論理的な構造要素にリンクします。開発者は通常、コンテンツが視覚的にレンダリングされると同時に、アクセシビリティの目的で意味的に識別されることを保証するために、BeginMarkedContentSequenceを構造ツリーの構築と組み合わせて使用します。

関連用語

  • PDPageContentStream – マークされたコンテンツシーケンスを含む、PDFページにコンテンツオペレーターを書き込むために使用されるApache PDFBoxクラス
  • Tagged PDF – マークされたコンテンツと構造ツリーを使用して論理的なドキュメント構成を定義するPDFドキュメント構造
  • Content Stream – PDFページの外観を記述するPDFオペレーターとオペランドのシーケンス
  • Structure Tree – マークされたコンテンツによって参照される、PDFドキュメントの論理構造の階層的表現
  • PDF/UA – マークされたコンテンツとタグ付けの適切な使用を要求する、アクセシブルなPDFドキュメントのためのISO標準

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html