Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDTextState

PDTextStateは、Apache PDFBox PDModel APIにおいて、PDFドキュメントのテキスト状態パラメータを表現および管理するクラスです。

キーワード: pdtextstate, PDTextState

概要

PDTextStateは、Apache PDFBox PDModel APIにおいて、PDFドキュメントのテキスト状態パラメータを表現および管理するクラスです。テキスト状態パラメータは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、フォント、フォントサイズ、文字間隔、テキストレンダリングモードなどの特性を含む、PDF内でのテキストの表示方法を制御します。このクラスは、PDFコンテンツストリームを扱う際に、これらのパラメータを読み取りや変更するための高レベルなアクセスを開発者に提供します。

定義

PDTextStateは、Apache PDFBoxの高レベルPDModel APIレイヤー内にあるJavaクラスで、PDFレンダリングで使用されるテキスト状態演算子とパラメータをカプセル化します。PDF仕様では、テキスト状態は一般的なグラフィックス状態とは別に、テキスト表示に特化したグラフィックス状態パラメータの集合として定義されています。PDTextStateは、文字間隔(Tc)、単語間隔(Tw)、水平スケーリング(Th)、行送り(Tl)、フォントとフォントサイズ(Tf)、テキストレンダリングモード(Trender)、テキストライズ(Trise)などのプロパティに対するgetterおよびsetterメソッドを提供します。このクラスは、PDF構文を直接操作する必要がある低レベルのコンテンツストリーム演算子とは異なり、便利なオブジェクト指向インターフェースを提供します。

重要性

PDFのテキスト抽出、生成、または変更を行う開発者にとって、PDTextStateはドキュメント内でのテキストの表示方法を理解し制御するために不可欠です。PDFからテキストを抽出する際、テキスト状態にアクセスすることで、テキストの配置や外観に影響するフォント情報、間隔、レンダリング特性を判断できます。PDFを作成または変更する際、テキスト状態を適切に管理することで、テキストが正しくレンダリングされ、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているアクセシビリティ要件を満たすことが保証されます。これは、テキスト属性を正確に表現する必要があるTagged PDFにおいて特に重要です。適切なテキスト状態管理がなければ、不正確な文字間隔、フォントの不一致、不適切なテキスト配置などの問題が発生する可能性があります。

仕組み

PDTextStateは、PDFコンテンツストリーム処理コンテキスト内で現在のテキスト状態の表現を維持することで機能します。PDFBoxがPDFコンテンツストリームを解析する際、テキスト状態演算子に遭遇するとPDTextStateオブジェクトを更新します。例えば、「Tf」演算子はフォントとフォントサイズを設定し、「Tc」は文字間隔を設定します。開発者は、コンテンツストリーム処理中に現在のテキスト状態を取得してテキストのレンダリング方法を理解したり、新しいコンテンツストリームを生成する際にテキスト状態プロパティを変更したりできます。このクラスは、PDFontなどの他のPDModelクラスと統合され、テキスト操作のための一貫性のあるAPIを提供します。テキスト状態パラメータは通常、テキスト表示演算子を使用してテキストが描画される前に設定され、これらのパラメータは明示的に変更されるまで有効です。このステートフルな動作は、グラフィックスおよびテキスト状態がページのレンダリング全体を通じて持続するPDFコンテンツストリームモデルに従っています。

関連用語

  • PDFont – PDFドキュメント内で使用されるフォントリソースを表すApache PDFBoxクラス
  • PDPage – テキスト状態が適用されるコンテンツストリームを含む、PDFドキュメント内の単一ページを表すクラス
  • PDResources – テキスト状態および他のグラフィックス操作から参照されるフォントや画像などのリソースを管理するクラス
  • Content Stream – ページの外観を記述するPDF演算子とオペランドのシーケンス
  • Graphics State – すべてのグラフィックスレンダリングを制御するパラメータのより広範なセット。テキスト状態はそのサブセット

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html