Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDStandardAttributeObject

概要

PDStandardAttributeObjectは、Apache PDFBoxの高レベルPDModel APIに含まれるクラスで、Tagged PDF文書で使用される標準構造属性オブジェクトを表します。これらの属性オブジェクトは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている論理文書構造ツリー内の構造要素のプロパティと特性を定義します。このクラスは、構造化コンテンツの外観、レイアウト、セマンティックプロパティを記述する属性の読み取りと変更を行うメソッドを提供し、アクセシブルで適切に構造化されたPDF文書の作成に不可欠です。

定義

PDStandardAttributeObjectは、Apache PDFBox内の具体的な実装クラスで、PDFの論理構造階層における構造要素に関連付けられた標準属性辞書をカプセル化します。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) において、属性オブジェクトには、構造要素の基本的なタイプと役割を超える追加情報を提供するキー・バリュー・ペアが含まれます。これらの属性には、レイアウトプロパティ(スペーシング、配置、寸法など)、リストプロパティ(番号付けスタイル)、テーブルプロパティ(行と列のスパン)、その他のプレゼンテーションまたはセマンティック特性が含まれます。

全投稿を閲覧 gdoc_arrow_right_alt

PDStream

概要

PDStreamは、Apache PDFBox PDModel APIの高レベルクラスで、Javaデベロッパーにオブジェクト指向のインターフェースを提供し、PDFストリームオブジェクトの読み取りと操作を可能にします。ストリームオブジェクトはPDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) の基本的なコンポーネントであり、ページコンテンツ、画像、フォント、メタデータなど、さまざまな種類のデータを格納します。PDStreamは、生のPDFストリーム構文を扱う複雑さを抽象化し、デベロッパーがより直感的なプログラムインターフェースを通じて、ページ、リソース、注釈、フォームなどのPDF構造を操作できるようにします。

定義

PDStreamは、Apache PDFBoxの高レベルPDModel APIレイヤーの一部で、PDFストリームオブジェクトをJavaオブジェクトとして表現するように設計されています。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、ストリームオブジェクトはディクショナリとそれに続くstreamendstreamキーワードで囲まれたバイナリまたはテキストデータで構成されます。PDStreamはこの構造をカプセル化し、ストリームのディクショナリ(メタデータ)とそのデータコンテンツの両方にアクセスするメソッドを提供します。PDF構文の手動解析が必要な低レベルAPIとは異なり、PDStreamはエンコーディング、フィルタリング、圧縮、解凍を自動的に処理します。これは、PDFBoxの低レベルCOS APIにおけるContent Object StreamクラスであるCOSStreamとは異なり、生の構文アクセスではなくドキュメントモデルのセマンティクスを提供するため、構文レベルではなく構造レベルでPDFコンテンツを扱う必要があるアプリケーションデベロッパーにとって望ましい選択肢となっています。

全投稿を閲覧 gdoc_arrow_right_alt

PDStructureElement

概要

PDStructureElementは、Apache PDFBoxライブラリにおけるJavaクラスで、PDF文書内の構造要素を扱うための高レベルAPIを提供します。構造要素は、タグ付きPDF文書の構成要素であり、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、コンテンツの論理構造と読み上げ順序を定義します。このクラスにより、開発者はPDF文書をアクセシブルかつ機械可読にする構造階層を、プログラムによって読み取り、作成、修正することができます ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

全投稿を閲覧 gdoc_arrow_right_alt

PDStructureElementNameTreeNode

概要

PDStructureElementNameTreeNodeは、Apache PDFBoxライブラリのJavaクラスで、PDFの論理構造階層において要素識別子から構造要素へのマッピングに使用される名前ツリーのノードを表します。名前ツリーは、割り当てられたIDによって構造要素を効率的に検索するための仕組みを提供し、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているタグ付きPDFのナビゲーションおよびアクセシビリティ機能に不可欠です。このクラスは、開発者がPDF文書構造をプログラムでアクセス・操作するために使用する、PDFBoxの高レベルPDModel APIの一部です。

定義

PDStructureElementNameTreeNodeは、Apache PDFBoxのPDF名前ツリー実装における特殊なノードクラスで、構造要素IDツリー専用に設計されています。PDF文書において、名前ツリーは辞書ベースのデータ構造であり、効率的な検索のために平衡木構造を使用して文字列キーをPDFオブジェクトにマッピングします。単純な辞書とは異なり、名前ツリーは中間ノードとリーフノードにエントリを分散させることで、大量のエントリを処理できます。構造要素名前ツリーは、具体的にID文字列(/IDエントリを介して構造要素に割り当てられる)を対応する構造要素辞書にマッピングし、構造ツリー全体を走査することなくタグ付きコンテンツ要素への直接アクセスを可能にします。これは、コンテンツの階層的な構成を表す構造ツリールート(PDStructureTreeRoot)とは異なり、名前ツリーは一意の識別子に基づく代替的なフラットアクセス方法を提供します。

重要性

アクセシブルなPDFやタグ付きコンテンツを扱う開発者にとって、PDStructureElementNameTreeNodeは効率的な要素検索とナビゲーション機能の実装に不可欠です。支援技術リーダー、PDFアクセシビリティバリデーター、コンテンツ抽出ツールなど、IDによって特定の構造要素を検索する必要があるアプリケーションを構築する際、名前ツリーはツリー全体の走査を必要とせず、O(log n)の検索パフォーマンスを提供します。これは、スクリーンリーダーやその他の支援技術が特定の構造要素への迅速なアクセスを必要とする ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 準拠文書において特に重要です。タグ付きPDFを作成または変更する開発者は、 ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) ワークフローでコンテンツ要素を追加、削除、または再構成する際に、ID参照が有効かつアクセシブルな状態を保つために、名前ツリーを適切に維持する方法を理解する必要があります。

全投稿を閲覧 gdoc_arrow_right_alt

PDStructureNode

概要

PDStructureNodeは、Apache PDFBox PDModel APIにおける高レベルのJavaクラスで、PDF文書の構造要素へのプログラマティックなアクセスを提供します。このクラスを使用することで、開発者はPDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) に従って、ページ、リソース、注釈、フォームなどのPDF構造を読み取り、変更することができます。PDStructureNodeは、アクセシビリティ機能をサポートするTagged PDFを含む、構造化されたPDFコンテンツを扱うための基盤となるコンポーネントです ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html )

全投稿を閲覧 gdoc_arrow_right_alt

PDStructureTreeRoot

概要

PDStructureTreeRootは、Apache PDFBoxライブラリにおいて、PDFドキュメントの論理構造ツリーのルートを表すクラスです。このクラスは、Tagged PDFドキュメントにおけるコンテンツの読み上げ順序と意味的な構成を定義する構造階層へのプログラマティックなアクセスを提供します。これはアクセシビリティとコンテンツ抽出に不可欠な要素です ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。PDFページ上にレンダリングされる視覚的なコンテンツに意味を与える構造要素をナビゲートし操作するためのエントリーポイントとして機能します。

定義

PDStructureTreeRootは、Apache PDFBoxのPDModelパッケージに含まれる高レベルAPIクラスで、PDF仕様で定義されているStructTreeRoot辞書をカプセル化します ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この辞書はPDFの構造階層の最上位に位置し、ドキュメントコンテンツの論理的な構成を記述するすべての構造要素への参照を含んでいます。低レベルのCOSObjectによる表現とは異なり、PDStructureTreeRootは構造要素間の親子関係、カスタム構造タイプを定義するロールマップ、属性継承のためのクラスマップにアクセスするための開発者フレンドリーなメソッドを提供します。

全投稿を閲覧 gdoc_arrow_right_alt

PDTableAttributeObject

概要

PDTableAttributeObjectは、Apache PDFBoxのPDModel APIに含まれるクラスで、Tagged PDF文書の論理構造内における表属性オブジェクトを表します。これらのオブジェクトは、PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている表構造に関するメタデータを保存し、支援技術やその他のアプリケーションが表形式データを適切に解釈できるようにします。表属性は、PDF/UA ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準に準拠したアクセシブルなPDF文書を作成するために不可欠です。

全投稿を閲覧 gdoc_arrow_right_alt

PDTerminalField

概要

PDTerminalFieldは、Apache PDFBox PDModel APIのクラスで、PDFインタラクティブフォーム(AcroForm)におけるターミナルフィールド(終端フィールド)を表します。ターミナルフィールドは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、フォームのフィールド階層における葉ノードであり、実際にデータ値を保持し、ユーザー操作のためのウィジェット注釈と関連付けられています。これらのフィールドには、テキストボックス、チェックボックス、ラジオボタン、リストボックス、その他のインタラクティブフォーム要素が含まれます。PDTerminalFieldは、開発者がプログラム的にフィールドのプロパティ、値、および外観特性を読み取り、変更するためのメソッドを提供します。

定義

PDTerminalFieldは、Apache PDFBoxの高レベルJavaクラスで、AcroForm構造内のターミナル(葉)フィールドというPDF仕様の概念をカプセル化したものです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、ターミナルフィールドは子フィールドを持たない点で非ターミナルフィールドと異なり、フォームフィールド階層の終端となります。非ターミナルフィールドが関連するフィールドをグループにまとめるためのコンテナとして機能するのに対し、ターミナルフィールドはページ上の単一のインタラクティブ要素を直接表現し、データを収集または表示します。

全投稿を閲覧 gdoc_arrow_right_alt

PDTextField

概要

PDTextFieldは、Apache PDFBoxライブラリに含まれるJavaクラスで、PDF文書内のテキストフィールドフォーム要素を表現します。PDAnnotationWidgetクラスを拡張し、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDFフォームでユーザーが操作可能なテキスト入力フィールドをプログラムで作成、読み取り、変更するためのメソッドを提供します。このクラスは、PDFの内部構造の複雑さを開発者にとって扱いやすいJavaオブジェクトに抽象化するPDFBoxの高レベルPDModel APIの一部です。

定義

PDTextFieldは、Apache PDFBox内の特殊なクラスで、PDF仕様のテキストフィールドウィジェットアノテーションに対応します。PDF形式仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) において、テキストフィールドはユーザーがテキストデータを入力および編集できるインタラクティブなフォーム要素(AcroFormフィールド)です。チェックボックス、ラジオボタン、ドロップダウンリストなどの他のPDFアノテーションやフォームフィールドタイプとは異なり、PDTextFieldは特に単一行および複数行のテキスト入力シナリオを処理します。

全投稿を閲覧 gdoc_arrow_right_alt

PDTextState

概要

PDTextStateは、Apache PDFBox PDModel APIにおいて、PDFドキュメントのテキスト状態パラメータを表現および管理するクラスです。テキスト状態パラメータは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、フォント、フォントサイズ、文字間隔、テキストレンダリングモードなどの特性を含む、PDF内でのテキストの表示方法を制御します。このクラスは、PDFコンテンツストリームを扱う際に、これらのパラメータを読み取りや変更するための高レベルなアクセスを開発者に提供します。

定義

PDTextStateは、Apache PDFBoxの高レベルPDModel APIレイヤー内にあるJavaクラスで、PDFレンダリングで使用されるテキスト状態演算子とパラメータをカプセル化します。PDF仕様では、テキスト状態は一般的なグラフィックス状態とは別に、テキスト表示に特化したグラフィックス状態パラメータの集合として定義されています。PDTextStateは、文字間隔(Tc)、単語間隔(Tw)、水平スケーリング(Th)、行送り(Tl)、フォントとフォントサイズ(Tf)、テキストレンダリングモード(Trender)、テキストライズ(Trise)などのプロパティに対するgetterおよびsetterメソッドを提供します。このクラスは、PDF構文を直接操作する必要がある低レベルのコンテンツストリーム演算子とは異なり、便利なオブジェクト指向インターフェースを提供します。

重要性

PDFのテキスト抽出、生成、または変更を行う開発者にとって、PDTextStateはドキュメント内でのテキストの表示方法を理解し制御するために不可欠です。PDFからテキストを抽出する際、テキスト状態にアクセスすることで、テキストの配置や外観に影響するフォント情報、間隔、レンダリング特性を判断できます。PDFを作成または変更する際、テキスト状態を適切に管理することで、テキストが正しくレンダリングされ、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているアクセシビリティ要件を満たすことが保証されます。これは、テキスト属性を正確に表現する必要があるTagged PDFにおいて特に重要です。適切なテキスト状態管理がなければ、不正確な文字間隔、フォントの不一致、不適切なテキスト配置などの問題が発生する可能性があります。

全投稿を閲覧 gdoc_arrow_right_alt