Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

CIDSystemInfo

概要

CIDSystemInfoは、Apache PDFBoxにおいて、PDF文書内のCIDキー付きフォントで使用される文字コレクションに関するメタデータを表現するディクショナリです。このクラスは、PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているCIDSystemInfoディクショナリに対応しており、コンポジットフォントの文字コレクションと順序付けスキームを識別します。PDFBoxにおいて、CIDSystemInfoクラスは、東アジア言語などで使用される大規模な文字セットをサポートするフォント内で、文字がどのように組織化され識別されるかについての情報を読み取り、操作することを可能にします。

定義

CIDSystemInfoは、Apache PDFBoxのJavaクラスであり、Registry、Ordering、Supplementという3つの主要なプロパティをカプセル化します。これらのプロパティは、CIDキー付きフォントで使用される文字コレクションを一意に識別します。Registryフィールドは文字コレクションの発行者を識別し(通常は「Adobe」)、Orderingフィールドは特定の文字コレクション(「Japan1」や「GB1」など)を指定し、Supplementフィールドはそのコレクションのバージョンを示します。この情報は、コンポジットフォントにおける文字識別子(CID)を正しく解釈するために不可欠です。コンポジットフォントは、シンプルフォントで使用される直接エンコーディングではなく、2段階のプロセスを通じて文字コードをグリフにマッピングします。

重要性

PDFBoxを使用する開発者にとって、複雑なスクリプトや国際化されたコンテンツを含むPDF文書を処理する際に、CIDSystemInfoを理解することは不可欠です。CIDSystemInfoを適切に処理することで、文字コレクションが正しく識別され、テキスト抽出の精度、フォント置換、文書のレンダリングに直接影響します。これは特に、支援技術のために正しい文字とグリフのマッピングを維持する必要があるアクセシブルなPDF ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) を作成する際に重要です。CIDSystemInfoを正しく解釈しないと、東アジア言語、アラビア語、その他の複雑なスクリプトを使用する文書からテキストを適切に抽出できず、データの損失や文字化けした出力につながる可能性があります。

全投稿を閲覧 gdoc_arrow_right_alt