Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Font subtype Type0

Font subtype Type0は、PDF内で大規模な文字セットを使用可能にする複合フォント形式であり、特にCJK(中国語、日本語、韓国語)言語や数千のグリフを持つその他のスクリプトに使用されます。

カテゴリ: Text & Fonts
キーワード: font subtype type0, Font subtype Type0

概要

Font subtype Type0は、PDF内で大規模な文字セットを使用可能にする複合フォント形式であり、特にCJK(中国語、日本語、韓国語)言語や数千のグリフを持つその他のスクリプトに使用されます。シングルバイト文字コードを使用するシンプルフォントとは異なり、Type0フォントはマルチバイトエンコーディングを使用し、階層構造を通じて文字コードをグリフにマッピングします ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このフォントサブタイプは、PDF文書でUnicodeテキストや複雑な文字体系を表示するために不可欠です。

定義

Type0フォントは、フォント辞書内の/Type0サブタイプエントリによって識別されるPDFの複合フォントリソースです。256グリフに制限されるシンプルフォントタイプ(Type1、TrueType、Type3)とは異なり、Type0フォントは2段階のマッピング構造を使用することで、事実上無制限のサイズの文字セットをサポートします。Type0フォント自体は、実際のグリフ記述を含む1つ以上の子孫CIDFont(Character Identifierフォント)を参照するコンテナとして機能します。

Type0フォントの主な特徴は、CMapCharacter Map)リソースを通じてマルチバイト文字コードを使用できることです。CMAPは、コンテンツストリームからのマルチバイト文字コードがどのようにCharacter Identifier(CID)にマッピングされ、さらに子孫CIDFont内の実際のグリフにマッピングされるかを定義します。このアーキテクチャにより、Type0フォントは大規模な文字セットを持つ言語を効率的に表現しながら、適切なテキスト抽出とアクセシビリティに必要な柔軟性を維持できます ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

Type0フォントは、エンコーディングメカニズムにおいてシンプルフォントと根本的に異なります。シンプルフォントは直接的なシングルバイトエンコーディングを使用するのに対し、Type0フォントは間接的な2段階マッピングプロセスを採用し、はるかに優れた拡張性と柔軟性を提供します。

重要性

国際的なPDF文書を扱う開発者にとって、Type0フォントは適切なテキストレンダリングと抽出に不可欠です。CJK言語、アラビア語、ヘブライ語、またはその他の複雑なスクリプトを含むPDFを作成する際、Type0フォントはこれらの文字セットを正しく埋め込み表示するための唯一の実用的なメカニズムを提供します。Type0フォントを理解していないと、開発者はPDFアプリケーションで文字化け、文字の欠落、または不正なUnicodeマッピングの問題に遭遇する可能性があります。

Type0フォントは、アクセシビリティとTagged PDFの実装において特に重要です。スクリーンリーダーや支援技術は、Type0フォント内の適切なマッピング構造に依存して、視覚的なグリフを音声読み上げのためのUnicodeテキストに変換します ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。誤って構成されたType0フォントは、テキスト抽出を破損させ、文書を障害を持つユーザーにとってアクセス不可能にし、PDF/UA準拠要件を満たさなくなります。

さらに、Type0フォントはPDFファイルサイズの最適化にも影響します。CIDキーフォントを使用することで、開発者はフォントをより効率的にサブセット化でき、数千グリフを持つフォントファイル全体を埋め込むのではなく、文書内で実際に使用されるグリフのみを含めることができます。この理解は、国際言語サポートとファイルサイズの制約のバランスを取る必要があるPDF生成システムを構築する開発者にとって重要です。

仕組み

Type0フォントは、PDFフォント辞書内で定義された階層構造を通じて動作します。Type0フォント辞書には、いくつかの必須エントリが含まれます:/Type(常に/Font)、/Subtype(常に/Type0)、/BaseFont(フォント名)、/Encoding(事前定義されたCMap名またはCMapストリーム)、および/DescendantFonts(1つのCIDFont辞書を含む配列) ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

テキストレンダリングプロセスは、PDFプロセッサがコンテンツストリーム内でマルチバイト文字コードに遭遇したときに開始されます。これらのコードは、Type0フォントの/Encodingエントリで指定されたCMapに渡されます。CMAPは、これらの文字コードをCID(Character Identifier)に変換します。CIDは、フォントの文字コレクション内でグリフを一意に識別する数値です。文字コレクションは、子孫CIDFont内で定義され、Adobe-Japan1やAdobe-GB1などのグリフの特定の順序を表します。

/DescendantFonts配列で指定されるCIDFontは、CIDFontType0(CFF/Type1アウトラインベース)またはCIDFontType2(TrueTypeアウトラインベース)のいずれかです。CIDFont辞書には、実際のグリフ記述とメトリクスが含まれ、文字コレクションのレジストリ、順序、補足レベルを識別する/CIDSystemInfoエントリも含まれます。この情報により、異なるPDFプロセッサ間でCIDが一貫して解釈されることが保証されます。

テキスト抽出とアクセシビリティの場合、システムは逆方向に動作します。CIDはUnicode値に逆マッピングされる必要があります。これは、通常フォント辞書で指定されるToUnicode CMAPを通じて実現されます。この逆マッピングは、アクセシブルなPDFでのコピー&ペースト操作、検索、およびスクリーンリーダー機能に不可欠です。

関連用語

  • CIDFont – Type0フォントによって参照される子孫フォントで、実際のグリフ定義を含み、文字コードの代わりにCharacter Identifier(CID)を使用します
  • CMap – 文字コードとCIDの間、またはCIDとUnicode値の間の対応を定義するマッピングリソース
  • Font Subtype – PDFフォントリソースの分類で、その構造とエンコーディングメカニズムを決定します。Type0、Type1、TrueType、Type3などが含まれます
  • ToUnicode CMap – CIDからUnicode値への逆マッピングを提供する特殊なCMapで、テキスト抽出とアクセシビリティ機能を可能にします
  • Font Embedding – 異なるシステムやプラットフォーム間で一貫したテキストレンダリングを確保するために、フォントプログラムデータをPDFファイル内に含めるプロセス

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html