PDCIDFontType2
PDCIDFontType2は、Apache PDFBox PDModel APIのクラスで、PDF文書におけるCIDFont Type 2フォントディクショナリを表します。
PDCIDFontType2は、Apache PDFBox PDModel APIのクラスで、PDF文書におけるCIDFont Type 2フォントディクショナリを表します。CIDFont Type 2フォントは、TrueTypeフォントプログラムをグリフ記述に使用する文字集合フォントで、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、中国語、日本語、韓国語(CJK)などの複雑なスクリプトや大規模文字セットに一般的に使用されます。このクラスは、開発者にPDF構造内のCIDFont Type 2フォントプロパティを読み取り、操作するためのプログラマティックなアクセスを提供します。
PDCIDFontType2は、Apache PDFBoxにおいてCIDFont Type 2フォントディクショナリを扱う機能をカプセル化した高レベルのJavaクラスです。PDF仕様 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) において、CIDFont Type 2は、CIDFont Type 0で使用されるType 1フォントアウトラインとは異なり、TrueTypeフォント技術に基づくグリフ記述を持つCIDFontです。CIDFontの「CID」はCharacter Identifier(文字識別子)の略で、文字コードではなくCID番号で文字を識別する大規模文字集合を扱うシステムを指します。
文字コードを直接グリフにマッピングする単純なフォントとは異なり、CIDFontは、文字コードをCIDに変換するCMap(Character Map)を介し、さらにCIDを実際のグリフ記述にマッピングするという、より洗練されたアーキテクチャを使用します。PDCIDFontType2は特にTrueTypeグリフ記述を使用するCIDFontを処理するため、東アジアのタイポグラフィや単純なフォントの256文字制限を超える大規模文字セットを含むPDFの処理に不可欠です。
このクラスは、PDFBox内の他のフォント関連クラス、例えばPDType0Font(CIDFontを使用する複合フォントを表す)やPDTrueTypeFont(CIDアーキテクチャを使用しない単純なTrueTypeフォントを表す)とは異なります。PDCIDFontType2は、Type 0複合フォント階層内の下位フォントレベルで動作します。
PDCIDFontType2を理解し、使用することは、特にCJKテキストを含む国際的な文書を扱うPDF処理アプリケーションを構築する開発者にとって極めて重要です。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準に準拠したアクセシブルなPDFを作成する際、適切なフォント処理により、スクリーンリーダーやその他の支援技術がテキストを正しく抽出できるようになります。正しいCIDFont実装がなければ、テキスト抽出が失敗したり、文字化けした出力が生成され、アクセシビリティ機能が損なわれる可能性があります。
使用されている文字のみを埋め込んでファイルサイズを削減するフォントサブセット化操作を実行する開発者にとって、PDCIDFontType2は、グリフメトリクス、文字マッピング、および基礎となるTrueTypeフォントプログラムにアクセスするために必要なメソッドを提供します。これは、Web配信やアーカイブストレージのためにファイルサイズを最小化しながら視覚的な忠実性を維持する必要があるエンタープライズドキュメントワークフローにおいて特に重要です。
さらに、Tagged PDF ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) を扱う際、CIDFont Type 2フォントを正しく処理することで、論理構造ツリーがテキストコンテンツを適切に参照および抽出できるようになり、これはドキュメントのリフロー、コンテンツ抽出、および自動化されたドキュメント処理ワークフローに不可欠です。
PDCIDFontType2は、PDCIDFont基底クラスを拡張し、TrueTypeベースのCIDフォントに固有のメソッドを実装します。PDFBoxがPDFを解析する際、ライブラリはフォントディクショナリを調査し、フォントのSubtypeエントリに基づいて適切なクラスをインスタンス化します。CIDFont Type 2の場合、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、PDF構造内のSubtypeは「/CIDFontType2」となります。
このクラスは、いくつかの主要なコンポーネントへのアクセスを提供します:
フォントディスクリプタ: 親クラスから継承されたメソッドを通じて、PDCIDFontType2は、アセント、ディセント、キャップハイト、および埋め込まれたTrueTypeフォントストリーム自体などのメトリクスを含むフォントディスクリプタディクショナリへのアクセスを提供します。
CIDSystemInfo: このディクショナリは、「Adobe-Japan1-6」や「Adobe-GB1-5」などの文字集合を識別し、フォントで利用可能なCIDのセットとその順序を定義します。
幅情報: CIDFontは、単純なフォントよりも複雑な幅仕様を使用し、通常は「W」エントリ(幅配列)または「DW」エントリ(デフォルト幅)を使用します。PDCIDFontType2は、特定のCIDのグリフ幅を取得するメソッドを提供します。
CIDToGIDMap: このマッピング(または「Identity」マッピング)は、CIDをTrueTypeフォントプログラム内のGlyph ID(GID)に変換し、レンダラーが各文字識別子に対して正しいグリフアウトラインを見つけられるようにします。
開発者は通常、PDType0Font(複合フォント)を通じてPDCIDFontType2と間接的に対話しますが、フォント解析、グリフ置換、カスタムレンダリング実装などの高度な操作には直接アクセスが必要です。このクラスは、PDFBoxのリソース管理システムと統合され、複数のフォントインスタンスを持つ大規模なドキュメントを処理する際の適切なキャッシングとメモリ処理を保証します。
- PDType0Font – PDCIDFontType2などのCIDFontを下位フォントとして使用するType 0フォントを表す複合フォントクラス
- CMap – CIDFontワークフローにおいて文字コードを文字識別子に変換する文字対CIDマッピングリソース
- PDTrueTypeFont – CIDアーキテクチャを使用しないフォント用の単純なTrueTypeフォントクラス
- Font Descriptor – フォントメトリクスと埋め込みフォントプログラムデータを含むディクショナリ
- Glyph Substitution – フォントレンダリングにおいて文字識別子を実際のグリフアウトラインに置換またはマッピングするプロセス
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
