Differences array
Differences arrayは、フォントエンコーディング辞書内の特定のエントリで、開発者が個々の文字コードを特定のグリフ名に再マッピングできるようにします。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、この配列は、完全に新しいエンコーディングスキームを定義することなく、選択された文字コードのデフォルトエンコーディングをオーバーライドする仕組みを提供します。Differences arrayは、カスタムフォントを使用する場合や、特定のグリフを非標準の文字位置でアクセスする必要がある場合に特に重要です。
Differences arrayは、PDFフォントのEncoding辞書内の配列オブジェクトで、ベースエンコーディングに対する例外を指定します。この配列は、数値コードとグリフ名のシーケンスが交互に並んだ構造で、各数値は開始文字コードを示し、その後に1つ以上のグリフ名が続きます。これらのグリフ名は、そのコード位置から順次マッピングされます。256個すべての文字コードに対するマッピングを定義する完全なエンコーディングベクターとは異なり、Differences arrayは、ベースエンコーディング(WinAnsiEncoding、MacRomanEncoding、StandardEncodingなど)とは異なるコードのみを指定します。
Differences arrayは、カスタムエンコーディング辞書とは異なり、既存のベースエンコーディングを完全に置き換えるのではなく、それを基に構築されます。これにより、わずかな文字コードマッピングのみを変更する必要がある場合に、より効率的になります。配列形式により、単一の配列内に複数の差分シーケンスを含めることができ、非連続のコード変更が可能になります。
PDF生成やテキスト抽出を行う開発者にとって、Differences arrayを理解することは、以下の理由から非常に重要です。
