Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Font byte offset

フォントバイトオフセットは、PDFドキュメントに埋め込まれたフォントファイルまたはフォントストリーム内の特定のグリフまたは文字定義の位置を示す数値です。

カテゴリ: Text & Fonts
キーワード: font byte offset, Font byte offset

概要

フォントバイトオフセットは、PDFドキュメントに埋め込まれたフォントファイルまたはフォントストリーム内の特定のグリフまたは文字定義の位置を示す数値です。PDFワークフローでは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているTrueType、OpenType、またはType 1フォントを扱う際に、バイトオフセットを使用してフォントデータを効率的に特定しアクセスします。これらのオフセットにより、PDFプロセッサはフォントファイル全体を解析することなく、特定の文字定義に素早く移動できます。

定義

フォントバイトオフセットは、フォントデータストリームの先頭から、そのストリーム内の特定の位置までのバイト単位の距離を表します。PDFドキュメントでは、フォントはバイナリストリームとして埋め込まれることが多く、バイトオフセットはこれらのストリーム内の特定のテーブル、グリフ、またはフォントプログラム命令へのポインタとして機能します。この概念は、TrueTypeフォントを扱う際に特に重要です。TrueTypeフォントは、オフセットテーブルを使用してフォントデータを個別のテーブル(グリフデータ用の’glyf’、水平メトリクス用の’hmtx’、グリフ位置用の’loca’など)に整理しています。どの文字を表示するかを識別する文字コードやグリフIDとは異なり、バイトオフセットはバイナリデータ内のどこにその文字の定義があるかを指定します。

重要性

フォントバイトオフセットの理解は、PDF生成、フォントサブセット化、または低レベルのPDF操作を行う開発者にとって非常に重要です。PDFドキュメントをプログラム的に作成または修正する際、バイトオフセットを正確に計算し管理することで、PDFレンダラーがグリフを正しく特定し表示できるようになります。バイトオフセットが不正確だと、文字の欠落、レンダリングエラー、またはフォントデータの破損が発生する可能性があります。ドキュメント内で実際に使用される文字のみを含める一般的な最適化技術であるフォントサブセット化を実装する開発者にとって、サブセット化されたフォントのバイトオフセットを再計算することは不可欠です。さらに、PDF内のフォント関連の問題をデバッグする際、バイトオフセットを調べることで、フォント埋め込みやフォントストリームの構造的な破損に関する問題を特定できます。

仕組み

PDFプロセッサがレンダリングが必要なテキストに遭遇すると、フォント辞書を参照して埋め込まれたフォントストリームを特定します。TrueTypeおよびOpenTypeフォント内では、’loca’(location)テーブルに、‘glyf’テーブル内の個々のグリフ定義を指すバイトオフセットが含まれています。プロセッサは文字コードを使用してグリフIDを決定し、次にそのグリフIDを’loca’テーブルで検索してバイトオフセットを取得し、最後にフォントストリーム内のその位置にシークしてグリフアウトラインデータを読み取ります。Type 1フォントの場合、バイトオフセットは個々の文字プログラムが格納されているCharStrings辞書内の位置を参照することがあります。フォントサブセット化操作では、削減された新しいグリフセットを反映するためにこれらのオフセットテーブルを再構築し、削除されたデータを考慮して各オフセットを調整する必要があります。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) のPDF仕様では、これらの内部オフセットメカニズムの適切な維持を含む、フォント埋め込みの構造と要件が定義されています。

関連用語

  • Font embedding(フォント埋め込み) – 一貫したレンダリングを保証するために、PDFドキュメント内にフォントデータを含めるプロセス
  • Glyph ID(グリフID) – フォント内の特定のグリフを一意に識別する数値識別子
  • Font subsetting(フォントサブセット化) – フォント全体ではなく、ドキュメント内で実際に使用される文字のみを含める技術
  • TrueType font(TrueTypeフォント) – 二次ベジェ曲線を使用し、データ構成にオフセットテーブルを多用するフォント形式
  • CIDFont – 中国語、日本語、韓国語などの大規模な文字セットを持つフォントに使用されるフォント形式

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html