EndMarkedContentSequence
EndMarkedContentSequenceは、Apache PDFBox Java APIにおけるクラスで、PDFドキュメント内のマーク付きコンテンツシーケンスを閉じるために使用されるEMC(End Marked Content)演算子を表します。
EndMarkedContentSequenceは、Apache PDFBox Java APIにおけるクラスで、PDFドキュメント内のマーク付きコンテンツシーケンスを閉じるために使用されるEMC(End Marked Content)演算子を表します。マーク付きコンテンツシーケンスは、PDF仕様 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された構造要素であり、コンテンツにセマンティック情報をタグ付けすることを可能にします。これはアクセシブルなPDFドキュメントを作成する上で不可欠です ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。この演算子は、コンテンツ領域を適切に区切るために、対応するBeginMarkedContent演算子とペアで使用する必要があります。
EndMarkedContentSequenceは、Apache PDFBoxのコンテンツストリーム演算子フレームワーク内の具象実装クラスです。PDFコンテンツストリーム内のマーク付きコンテンツシーケンスの終了を示すEMC演算子を特に処理します。PDF仕様において、マーク付きコンテンツシーケンスは対になっており、BMC(Begin Marked Content)またはBDC(Begin Marked Content with properties)演算子で開始され、EMC演算子で終了します。EndMarkedContentSequenceクラスは、PDFコンテンツストリームをプログラムで操作する際に、この閉じる演算子を書き込みまたは処理するために必要な機能をカプセル化します。テキストやグラフィックス演算子のように可視要素をレンダリングするコンテンツ演算子とは異なり、EndMarkedContentSequenceは純粋に構造的なもので、PDFの視覚的表示に影響を与えることなく、ドキュメントの構成とアクセシビリティメタデータを提供します。
PDFアクセシビリティ準拠やドキュメント構造の操作に取り組む開発者にとって、EndMarkedContentSequenceは適切にバランスの取れたマーク付きコンテンツシーケンスを維持するために不可欠です。Tagged PDF ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) を作成したり、既存のPDFコンテンツストリームを変更したりする際には、開かれたすべてのマーク付きコンテンツシーケンスを適切に閉じて、ドキュメントの妥当性を確保する必要があります。マーク付きコンテンツ演算子のバランスが不適切な場合、アクセシビリティ検証に失敗したり、支援技術でエラーが発生したり、PDF/UAバリデーターによって拒否されたりする可能性があります。EndMarkedContentSequenceを正しく使用する方法を理解することで、プログラムで生成または変更されたPDFが構造的整合性を維持し、障害を持つユーザーにとってアクセシブルであることを保証できます。
Apache PDFBoxでPDFコンテンツストリームを処理する際、EMC演算子が検出されるとEndMarkedContentSequenceクラスが呼び出されます。このクラスは演算子処理インターフェースを実装しており、PDFBoxのコンテンツストリーム解析パイプラインの一部として機能します。コンテンツストリーム書き込み操作中、開発者はEndMarkedContentSequenceをインスタンス化して、コンテンツストリームの適切な位置にEMC演算子を挿入できます。通常は、マーク付きコンテンツ領域内のすべてのコンテンツが書き込まれた後です。この演算子はオペランドを取りません。単に現在のマーク付きコンテンツコンテキストの終了を通知するだけです。PDFBoxはマーク付きコンテンツコンテキストの内部スタックを維持しており、EMC演算子は最新のコンテキストをこのスタックからポップし、前のネストレベルに戻ります。このスタックベースのアプローチにより、ネストされたマーク付きコンテンツシーケンスが適切に管理され、複数レベルのセマンティックタグ付けを持つ複雑なドキュメント構造を正確に作成および処理できます。
- BeginMarkedContent – マーク付きコンテンツシーケンスを開く演算子クラスで、EndMarkedContentSequenceとペアになります
- Tagged PDF – アクセシビリティのためにマーク付きコンテンツシーケンスに依存する構造マークアップを持つPDFドキュメント
- Content Stream – PDFページコンテンツの視覚的外観と構造を定義する演算子とオペランドのシーケンス
- PDF/UA – 適切に構造化されたマーク付きコンテンツを必要とするアクセシブルなPDFドキュメントのISO規格
- Marked Content Operator – コンテンツ領域を区切りタグ付けするために使用されるPDF演算子のファミリー(BMC、BDC、EMC)
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
