MCID
MCID(Marked-Content Identifier:マークコンテンツ識別子)は、PDFページ上の実際のコンテンツと、文書の論理構造ツリー内の対応する構造要素とのリンクを確立する一意の整数です。
MCID(Marked-Content Identifier:マークコンテンツ識別子)は、PDFページ上の実際のコンテンツと、文書の論理構造ツリー内の対応する構造要素とのリンクを確立する一意の整数です ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この識別子は、支援技術が表示されるコンテンツとその意味的な役割との関係を理解できるようにするため、PDFドキュメントのアクセシビリティにおいて不可欠です ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。PDF内のタグ付けされたすべてのコンテンツは、文書構造と適切に関連付けられるためにMCIDを持つ必要があります。
MCIDは、PDFのコンテンツストリーム内のマークコンテンツシーケンスに割り当てられる非負整数です。Tagged PDFの2つの重要な構成要素、すなわちコンテンツストリーム(実際のテキスト、画像、グラフィックスが描画される場所)と構造ツリー(コンテンツ要素の論理的な構成と意味的役割を定義するもの)との橋渡しをします ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。
PDF文書内の他の識別子とは異なり、MCIDはグローバルに一意である必要はありません。特定のページのコンテンツストリーム内でのみ一意であればよいのです。同じMCID値が異なるページに表示されても競合は発生しません。MCIDは通常ゼロから順次割り当てられますが、これは仕様で必須とされているわけではありません。
MCIDは、マークコンテンツオペレーターの一部として、特にタグ付けされたコンテンツに関連付けられたプロパティ辞書内のコンテンツストリームに現れます。MCIDは、/K(kids)エントリを通じてそれを参照する構造要素と連携して動作し、表現と構造の間の双方向マッピングを作成します。
PDFアクセシビリティに取り組む開発者にとって、MCIDは準拠したTagged PDFおよびPDF/UA文書を作成するための基本要素です ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。適切なMCID実装がない場合、スクリーンリーダーなどの支援技術は、正しい読み上げ順序でコンテンツに確実にアクセスしたり、その意味的な役割を理解したりすることができず、障害のあるユーザーにとって文書が事実上アクセス不可能になります。
プログラムによってPDFを生成または操作する際、MCIDを正しく割り当てて維持することで、以下が保証されます:
- コンテンツが視覚的な位置に関係なく、適切な論理的読み上げ順序で表示される
- 支援技術が文書構造を階層的にナビゲートできる
- コンテンツの変更がアクセシビリティ構造を破壊しない
- PDF/UA検証ツールが文書の準拠性を確認できる
MCIDを正しく実装しないことは、PDFアクセシビリティ障害の最も一般的な原因の1つであり、法的なアクセシビリティ要件を満たさない文書につながる可能性があります。
MCIDメカニズムは、ページのコンテンツストリームと構造ツリーの間の連携によって動作します。コンテンツストリームでは、マークコンテンツはBDC(Begin Marked Content with properties:プロパティ付きマークコンテンツ開始)やEMC(End Marked Content:マークコンテンツ終了)などのオペレーターで区切られます。MCIDはBDCオペレーターに渡されるプロパティ辞書で指定されます。
例えば、コンテンツストリームには次のような内容が含まれます:
/P <</MCID 0>> BDC
(This is a paragraph.) Tj
EMC
構造ツリー内の対応する構造要素は、このMCIDを参照します:
/Type /StructElem
/S /P
/P [親参照]
/Pg [ページ参照]
/K 0
ここで、構造要素の/K 0エントリは、参照されたページ上のMCID 0を指し、接続を確立します。構造要素は複数のMCIDを参照することができ(コンテンツが複数の領域にまたがる場合)、または独自のMCIDを持つ子構造要素を含むことができます。
PDFリーダーまたは支援技術が文書を処理する際、構造ツリーをトラバースし、MCIDを使用して、コンテンツがページ上のどこに視覚的に表示されるかに関係なく、正しい論理的順序で実際のコンテンツを見つけて抽出します。
- Tagged PDF – アクセシビリティのためのマークコンテンツを含む論理構造ツリーを持つPDF
- Structure Tree(構造ツリー) – 文書の論理構造の階層的表現
- Structure Element(構造要素) – 文書の意味的な構成要素を表す構造ツリーのノード
- Marked Content(マークコンテンツ) – その役割を示すためにマーキングオペレーターで区切られたPDFコンテンツストリーム内のコンテンツ
- PDF/UA – 適切なタグ付けとMCID使用を要求する、アクセシブルなPDF文書のISO規格
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
