Glyph positioning
グリフポジショニング(Glyph positioning)は、PDFページ上で各文字グリフをレンダリングする正確な位置を決定するプロセスです。
グリフポジショニング(Glyph positioning)は、PDFページ上で各文字グリフをレンダリングする正確な位置を決定するプロセスです。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、このポジショニングはテキストマトリックス、テキスト状態パラメータ、およびフォントメトリクスの組み合わせによって制御され、これらが連携してグリフ空間座標をページ座標に変換します。正確なグリフポジショニングは、正確なテキストレンダリング、検索機能、およびコンテンツ抽出に不可欠です。
グリフポジショニングとは、PDF文書のページ空間内で個々の文字グリフを座標ベースで配置することを指します。単純に文字を順次配置するだけのテキストレイアウトシステムとは異なり、PDFは変換マトリックスと間隔パラメータの高度なシステムを使用して各グリフを配置します。このポジショニングシステムは、テキストの開始位置と方向を定義するテキストマトリックス(Tm)と、グリフが描画される際に現在のテキスト位置を移動させる水平および垂直変位値を組み合わせて機能します。これにより、文字間隔、単語間隔、行の位置、およびテキストの回転を精密に制御できます。グリフポジショニングは、段落やテキストフローのような高レベルの概念を扱うのではなく、個々の文字レベルで動作する点でテキストレイアウトとは異なります。
PDF文書を扱う開発者にとって、グリフポジショニングの理解は複数の実用的なアプリケーションにおいて重要です。PDFからテキストを抽出する際には、グリフ位置の正確な解釈が、適切な単語境界、読み順序、およびテキスト要素間の空間的関係を再構築するために必要です。PDF生成においては、正確なグリフポジショニングにより、テキストが意図した位置に正確に表示され、特に複雑なタイポグラフィ、多言語、または数学表記を扱う場合に適切な配置が維持されます。不適切なグリフポジショニングは、視覚的には正しく見えてもアクセシビリティ要件を満たさない、または適切に検索や選択ができないテキストを生成する可能性があります。PDFリーダー、エディタ、または変換ツールを構築する開発者は、テキストを正確にレンダリングし、文書の忠実性を維持するために、ポジショニングオペレータを正しく解釈する必要があります。
PDFにおけるグリフポジショニングは、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された座標系変換プロセスを通じて動作します。テキストレンダリングシステムは、テキストマトリックス(Tm)とテキスト行マトリックス(Tlm)を維持し、グリフ空間座標をページ上のユーザー空間座標に変換します。テキスト表示オペレータを使用してテキストが表示されると、各グリフの位置は現在のテキストマトリックスから開始し、グリフの幅、文字間隔(Tcパラメータ)、単語間隔(スペース文字用のTwパラメータ)、および明示的な位置調整に基づいて水平変位を適用することで計算されます。グリフ表示後の水平変位の基本式は次のとおりです:tx = (w0 × Tfs + Tc + Tw) × Th、ここでw0はフォントからのグリフ幅、Tfsはフォントサイズ、Tcは文字間隔、Twは単語間隔(スペースにのみ適用)、Thは水平スケーリングです。垂直ポジショニングは、テキストライズ(Tsパラメータ)と行送りオペレータによって制御されます。Td(次の行の開始位置への移動)やTm(テキストマトリックスの設定)などのテキストポジショニングオペレータは、テキストが表示される場所を正確に制御し、TJ(個別のグリフポジショニングを伴うテキスト表示)などのオペレータは、カーニングやジャスティフィケーションのための文字レベルの調整を可能にします。
- Text matrix(テキストマトリックス) – テキストの位置、スケール、および方向を制御する変換マトリックス
- Text state parameters(テキスト状態パラメータ) – グリフポジショニングに影響を与える文字間隔、単語間隔、テキストライズなどの設定
- Font metrics(フォントメトリクス) – グリフ幅と間隔情報を定義するフォント内の測定データ
- Content stream(コンテンツストリーム) – テキスト表示とポジショニングオペレータを含むPDF内の命令シーケンス
- Glyph(グリフ) – フォントで定義された文字の視覚的表現
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
