CID (Character Identifier)
CID(Character Identifier)は、CIDFontにおいて文字コードをフォント内の特定のグリフにマッピングするために使用される数値です。
CID(Character Identifier)は、CIDFontにおいて文字コードをフォント内の特定のグリフにマッピングするために使用される数値です。CIDFontは、中国語、日本語、韓国語などのアジア言語を扱うために特に設計された、大規模な文字セットを処理できる複合フォントです ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。CIDFontは、文字コードをグリフ記述に直接マッピングするのではなく、CIDを中間層として使用することで、数千のグリフを効率的に管理できます。
CIDは、CIDFont内の特定のグリフ形状を識別するための内部識別子として機能する整数値です。文字コードが直接グリフを参照する単純なフォントとは異なり、CIDFontは2段階のマッピングプロセスを採用しています。まず文字コードからCIDへ、次にCIDから実際のグリフ記述へとマッピングします。このアーキテクチャにより、CIDFontは数万のグリフを含む文字コレクションをサポートしながら、効率的なアクセスと管理を維持できます。
CIDは、特定のCIDFontのコンテキスト外では固有の意味を持たない、フォント固有の識別子である点で文字コードとは異なります。あるフォントのCID 100は、別のフォントのCID 100とは全く異なるグリフを表す可能性があります。文字コード(Unicode値など)とCIDの間のマッピングは、CMap(Character Map)リソースによって定義されます。CMapは、文字エンコーディングシステムとフォントの内部グリフ構成の間の変換層として機能します。
CIDを理解することは、多言語PDFドキュメント、特に東アジア言語を含むドキュメントを扱う開発者にとって不可欠です。テキストのレンダリング、コンテンツの抽出、またはPDFの適切なアクセシビリティを確保する際、CIDマッピングシステムが文字が正しく表示されるかどうかを決定します。CIDマッピングが正しくない場合、グリフの欠落、誤った文字の表示、またはアクセシビリティ機能を損なうテキスト抽出の失敗が発生する可能性があります。
PDF生成または操作ライブラリを実装する開発者にとって、CIDFontとそのCID構造の適切な処理は、国際的なサポートにとって重要です。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているように、アクセシビリティ準拠のためにタグ付きPDFを作成する際、CIDキー付きフォントが適切に埋め込まれマッピングされていることは、支援技術がドキュメントコンテンツを正しく解釈できるかどうかに影響します。
CIDFontアーキテクチャは階層構造を使用しており、文字コードはまずCMapを通過してCIDを取得し、次にそのCIDがフォントのグリフ記述にインデックスします。PDFプロセッサがCIDFontを使用するテキストに遭遇すると、次の手順を実行します。
- テキスト文字列からの文字コードが関連付けられたCMapに渡される
- CMapがマッピングルールに従って文字コードをCIDに変換する
- CIDを使用して、CIDFontのCharStringsまたは類似のグリフデータ構造内の対応するグリフ記述を特定する
- 取得したグリフ記述を使用してグリフがレンダリングされる
CIDFontは文字コレクションに編成されています。文字コレクションは、一意の名前(Adobe-Japan1-6など)で識別される登録済みのグリフセットです。これらのコレクションは、複数のフォントが参照できる標準化されたCIDからグリフへのマッピングを定義し、異なるフォント実装間で一貫した文字表現を可能にします。CMapは、使用されている文字エンコーディングとCIDが参照する文字コレクションの両方を指定し、入力文字コードからレンダリングされたグリフまでの完全なチェーンを作成します。
- CIDFont – グリフ選択にCIDを使用する複合フォントタイプで、大規模な文字セット用に設計されている
- CMap – CIDFontにおいて文字コードをCIDに変換するマッピングリソース
- Glyph – 文字の視覚的表現であり、CIDによってインデックスされる最終的な出力
- Character Collection – 標準化されたCID割り当てを持つ登録済みのグリフセット
- Composite Font – 文字からグリフへのマッピングに複数のコンポーネントを使用するフォントアーキテクチャ
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
