Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PageExtractor

概要

PageExtractorは、Apache PDFBoxライブラリのユーティリティクラスであり、開発者がPDF文書から特定のページを抽出し、選択されたページのみを含む新しいPDFファイルを作成できるようにします。この機能は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDF文書を扱う際に不可欠であり、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているアクセシビリティ機能をサポートするタグ付きコンテンツ構造を含む、ページコンテンツの整合性を維持しながら文書構造をプログラムで操作することを可能にします。

全投稿を閲覧 gdoc_arrow_right_alt

PageLayout

概要

PageLayoutは、Apache PDFBox Java APIにおいて、PDFビューアでドキュメントを開いたときのPDFページの表示方法を表現・制御するクラスです。これはPDFドキュメントのカタログディクショナリ内のPageLayoutエントリに対応しており、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されている初期ページ表示配置を定義します。このクラスは、単一ページ、連続スクロール、見開き表示などの標準的なレイアウトモードを取得・設定するメソッドを提供します。

定義

PageLayoutは、Apache PDFBoxにおける列挙型スタイルのクラスで、PDF仕様で利用可能な様々なページレイアウトオプションをカプセル化します。ページレイアウトは、PDFを最初に開いたときの視覚的な表示モードを決定します。ページを一度に一つずつ表示するか、連続した縦列で表示するか、あるいは書籍の見開きのように向かい合わせで表示するかを指定します。PDFBoxでは、このクラスはSinglePage、OneColumn、TwoColumnLeft、TwoColumnRight、TwoPageLeft、TwoPageRightなどの標準レイアウト値を表す型安全な定数を提供します。どのパネル(ブックマーク、サムネイル)を表示するかを制御するページモード設定とは異なり、PageLayoutは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているメインドキュメント表示領域内のページコンテンツの空間配置を特に管理します。

全投稿を閲覧 gdoc_arrow_right_alt

PageMode

概要

PageModeは、Apache PDFBox Java APIのクラスで、PDFドキュメントをビューアアプリケーションで開いた際の表示方法を制御します。ブックマーク、サムネイル、または添付ファイルパネルをドキュメントコンテンツと共に表示するかどうかなど、初期表示設定を決定します。この設定はPDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているドキュメントカタログ構造の一部であり、開発者が特定のドキュメントタイプに最適化されたユーザーエクスペリエンスを提供できるようにします。

定義

PageModeは、Apache PDFBoxの列挙型クラスで、PDFドキュメントのカタログ辞書内のページモードエントリを表します。ページモードは、PDFを開いた際の初期表示状態を指定し、デフォルトで表示されるナビゲーションパネルや補助ウィンドウを制御します。一般的なページモードには、ドキュメントコンテンツのみを表示するモード(UseNone)、アウトライン/ブックマークパネルを表示するモード(UseOutlines)、ページサムネイルを表示するモード(UseThumbs)、添付ファイルを表示するモード(UseAttachments)、またはフルスクリーンモードでドキュメントを表示するモード(FullScreen)が含まれます。ページの配置方法(単一ページ、連続スクロール、見開きページ)を制御するページレイアウト設定とは異なり、PageModeは具体的にどの補助的なインターフェース要素を表示するかを制御します。この区別は重要です。PageModeはビューアのクロームとナビゲーション補助機能に影響を与えますが、ページレイアウトはドキュメントページ自体の空間的配置を決定します。

重要性

PageModeを正しく理解して実装することで、ドキュメントのアクセシビリティと使いやすさが向上します。技術マニュアルや構造化されたレポートのような複雑なナビゲーション構造を持つドキュメントの場合、PageModeをUseOutlinesに設定することで、ブックマークパネルが自動的に表示され、ユーザーがタグ付けされたコンテンツ ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) を効率的にナビゲートできるようになります。PDFポートフォリオや重要な添付ファイルを含むドキュメントの場合、UseAttachmentsモードを使用することで、ユーザーが利用可能なファイルをすぐに確認できます。アクセシビリティ重視のアプリケーションは、適切なPageMode設定から特に恩恵を受けます。これらの設定により、支援技術を使用するユーザーを、ドキュメントのタグ構造を補完する重要なナビゲーション機能へと誘導できるためです ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。PageMode設定を無視する開発者は、機能的には完全なPDFを作成しても、便利なナビゲーションツールを非表示にすることで、最適とは言えないユーザーエクスペリエンスを提供してしまう可能性があります。

全投稿を閲覧 gdoc_arrow_right_alt

Parser

概要

Apache PDFBoxにおけるParserは、PDFドキュメントのバイトレベルの構造を読み取り、解釈する専門的なJavaクラスです。PDFファイルは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された特定の構文規則を持つ複雑なバイナリ形式であり、Parserはこれらの生のバイトを構造化されたオブジェクトに変換し、Javaアプリケーションが操作できるようにします。PDFBoxは、基本的なドキュメント構造から特殊なコンテンツストリームまで、PDF解釈のさまざまな側面を処理する複数のParser実装を提供しています。

定義

Apache PDFBoxにおいて、ParserはPDF構文を読み取り、メモリ内のJavaオブジェクトに変換するロジックを実装するクラスです。Parserは、PDFファイルを順次または任意の順序で(Parserの種類に応じて)読み取り、相互参照テーブルを解釈し、PDFオブジェクトを検索して読み取り、PDFの構造を表すドキュメントオブジェクトモデルを構築します。PDFBoxには、標準的なPDFファイル用のPDFParserや、より低レベルのCatalog Object Structure解析用のCOSParserなどのParserが含まれています。汎用的なXMLやJSONのParserとは異なり、PDF Parserはバイナリデータ、圧縮されたストリーム、インクリメンタル更新、および ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されたPostScript由来の特殊な構文を処理する必要があります。Parserはドキュメント操作APIよりも低いレベルで動作し、より高レベルの操作を可能にする基礎層として機能します。

全投稿を閲覧 gdoc_arrow_right_alt

Parser.AbstractSyntaxHandler

概要

Parser.AbstractSyntaxHandlerは、Apache PDFBoxにおけるクラスで、PDF解析プロセス中にPDF構文要素を処理するためのフレームワークを提供します。この抽象クラスにより、開発者はPDFドキュメントを読み取る際に ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されたPDF構造をどのように解釈・処理するかをカスタマイズできます。これは、パーサーがPDFバイトストリーム内の異なる構文要素に遭遇した際に呼び出されるコールバック機構として機能します。

定義

Parser.AbstractSyntaxHandlerは、Apache PDFBoxライブラリにおける抽象基底クラスで、ドキュメント解析中に遭遇する様々なPDF構文要素に応答するためのメソッドを定義します。直接的なPDFオブジェクト操作クラスとは異なり、このハンドラは解析レイヤーで動作し、ファイルから読み取られる生のPDF構造を傍受して処理します。開発者はこのクラスを継承し、特定のメソッドをオーバーライドすることで、パーサーがオブジェクト、辞書、配列、ストリーム、その他のPDF構文要素に遭遇した際のカスタム動作を実装します。これは、既に解析済みのドキュメント構造を扱う高レベルなPDF処理APIとは異なり、解析パイプライン自体への低レベルなアクセスを提供します。

重要性

PDFを扱う開発者にとって、Parser.AbstractSyntaxHandlerはドキュメント解析の詳細な制御を可能にし、これはいくつかのユースケースにおいて不可欠です。解析中のPDF構造のカスタム検証、ドキュメント全体をメモリにロードすることなく特定のコンテンツを効率的に抽出すること、非標準または不正なPDFファイルを処理する必要がある特殊なPDFプロセッサの実装を可能にします。これは、メモリ効率が重要な大きなPDFファイルを扱う場合や、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの規格で定義されたドキュメント構造の詳細な理解を必要とするアクセシビリティ機能を実装する際に特に有用です。カスタム構文ハンドラは、潜在的に悪意のあるコンテンツを検出するためにPDF構造を分析するセキュリティスキャンツールの構築にも使用できます。

全投稿を閲覧 gdoc_arrow_right_alt

Parser.SyntaxHandler

概要

Parser.SyntaxHandlerは、Apache PDFBoxライブラリ内のクラスで、PDF解析プロセス中にPDF構文要素を処理するための特殊なインターフェースを提供します。PDFは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された構造化フォーマットに従っているため、このハンドラーにより、開発者はパーサーがPDFファイルのバイナリ構造を読み取る際に、オブジェクト、配列、辞書、ストリームなどの特定の構文要素をインターセプトして処理できます。このコンポーネントは、PDF構文への低レベルアクセスを必要とするカスタムPDF処理ワークフローを構築する開発者にとって不可欠です。

定義

Parser.SyntaxHandlerは、Apache PDFBoxにおける抽象クラスまたはインターフェースで、PDF解析操作中のコールバックメカニズムとして機能します。PDFBoxパーサーがPDFファイルを読み取り、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されたさまざまな構文要素に遭遇すると、SyntaxHandler実装の対応するメソッドを呼び出します。これにより、開発者はコアパーサーロジックを変更することなく、異なるPDF構造要素の処理方法に対してカスタム動作を定義できます。

全投稿を閲覧 gdoc_arrow_right_alt

PDAbstractPattern

概要

PDAbstractPatternは、Apache PDFBoxライブラリの高レベルPDModel API内の抽象基底クラスで、PDF文書内のパターンリソースを表します。パターンは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されている基本的なグラフィックスリソースタイプで、単純な色ではなく、繰り返しのデザインや複雑なシェーディング効果で描画することを可能にします。このクラスは、PDF文書内でタイリングパターン(繰り返しのグラフィック要素)とシェーディングパターン(段階的な色の遷移)の両方を扱うための基盤を提供します。

定義

PDAbstractPatternは、Apache PDFBoxにおけるパターン実装の親クラスとして機能し、具体的にはPDTilingPatternとPDShadingPatternの基底クラスです。抽象クラスとして、直接インスタンス化することはできませんが、PDF仕様で定義されているすべてのパターンタイプに共通する機能を提供します。PDFにおけるパターンは、基本的なカラースペースを超える高度なグラフィックスリソースであり、繰り返しテクスチャ、透かし、グラデーション塗りつぶしなどの複雑な視覚効果を実現します。単純な色値や画像とは異なり、パターンは一度定義されれば文書全体で複数回参照でき、繰り返しまたは段階的な視覚要素を効率的に表現できます。このクラスは、PDFBoxの低レベルCos(Carousel Object Structure)層と高レベルPDModel APIの橋渡しを行い、PDFパターン辞書とストリームを扱う複雑さを抽象化します。

重要性

PDF生成や操作を行う開発者にとって、PDAbstractPatternは視覚的に洗練された文書を作成するための重要な機能を提供します。カスタム背景、透かし、またはデータを複製せずに複数ページにわたって繰り返す必要があるブランドデザイン要素を実装する際、このクラスを理解することは極めて重要です。パターンリソースは、同じグラフィック要素の複数のコピーを埋め込む場合と比較して、大幅なファイルサイズの削減を実現します。これは、パターンが一度定義され、必要に応じて参照されるためです。さらに、パターンは ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などのアクセシビリティ標準への準拠を維持する上でも重要です。適切なパターン実装により、装飾要素が文書構造やコンテンツ抽出を妨げないことが保証されます。文書生成システム、レポートビルダー、またはPDF編集ツールに取り組む開発者は、このクラス階層を通じてパターン操作が必要なシナリオに頻繁に遭遇します。

全投稿を閲覧 gdoc_arrow_right_alt

PDAcroForm

概要

PDAcroFormは、Apache PDFBox PDModel APIの高レベルクラスであり、Javaデベロッパーに対してPDFドキュメント内のインタラクティブフォームデータへのプログラマティックなアクセスを提供します。AcroFormとも呼ばれるインタラクティブフォームは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された標準化機能であり、ユーザーがフィールドへの入力、チェックボックスの選択、データの送信を行うことができます。このクラスは、PDFBoxを使用してPDFファイル内のフォーム構造の読み取り、作成、変更を行うための主要なインターフェースとして機能します。

定義

PDAcroFormは、PDFドキュメントのAcroForm辞書を表現するJavaクラスであり、すべてのインタラクティブフォームフィールドとその関連プロパティを含みます。PDF仕様構造 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) において、AcroFormはユーザーから対話的に情報を収集するためのフィールドの集合として定義されています。PDAcroFormクラスは、低レベルのPDF辞書操作を抽象化し、テキストフィールド、チェックボックス、ラジオボタン、リストボックス、署名フィールドなどのフォーム要素を操作するための開発者フレンドリーなメソッドを提供します。

全投稿を閲覧 gdoc_arrow_right_alt

PDAction

概要

PDActionは、Apache PDFBoxのPDModel APIにおける高レベルクラスで、PDF文書内のアクションを表現します。アクションは、リンクのクリック、ページを開く、フォームの送信など、ユーザーの操作や文書イベントに応じて発生する動作を定義します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、アクションはインタラクティブ機能と文書内のナビゲーションを可能にする基本的なPDF構造です。

定義

PDActionは、Apache PDFBoxにおける抽象基底クラスで、PDF仕様で定義されているPDFアクション辞書のJava表現を提供します。このクラスは、PDActionGoTo(目的地へのナビゲーション)、PDActionURI(Webリンクを開く)、PDActionJavaScript(スクリプトの実行)、PDActionSubmitForm(フォーム送信)など、特定のアクションタイプの親クラスとして機能します。注釈や目的地のような静的な文書要素とは異なり、PDActionオブジェクトはトリガーに応答する実行可能な動作をカプセル化します。このクラスは、既存のPDF文書からアクションのプロパティを読み取るメソッドや、プログラムで新しいアクションを構築するメソッドを提供しており、JavaアプリケーションでインタラクティブなPDF機能を扱う開発者にとって不可欠です。

重要性

PDF文書を扱う開発者にとって、PDActionはインタラクティブ機能の実装と管理において極めて重要です。 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 標準に準拠したアクセシブルなPDFを作成する際、適切なアクション実装により、ナビゲーション支援とインタラクティブ要素が支援技術に対して正しく動作することが保証されます。PDActionを使用することで、開発者は既存の文書動作の抽出と分析、インタラクティブ要素の変更、新しいナビゲーション構造の作成、フォーム送信ワークフローの自動化が可能になります。PDActionの理解は、インタラクティブ性を保持または強化したり、カスタムナビゲーションパターンを実装したり、URIアクションとフォーム送信を通じてPDF文書をWebベースのワークフローと統合したりする必要があるPDF処理アプリケーションを構築する際に特に重要です。

全投稿を閲覧 gdoc_arrow_right_alt

PDActionFactory

概要

PDActionFactoryは、Apache PDFBoxの高レベルPDModel APIに含まれるユーティリティクラスで、PDFアクションオブジェクトの作成と管理のためのメソッドを提供します。PDF文書におけるアクションは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、ユーザーの操作や文書イベントに応答して発生する動作を定義します。このファクトリクラスは、注釈、フォームフィールド、文書イベントなどのインタラクティブ要素に添付できる様々なアクションタイプのインスタンス化プロセスを簡素化します。

定義

PDActionFactoryは、Apache PDFBox内で実装されたファクトリパターンであり、PDActionサブクラスのインスタンス作成を一元化します。PDF文書において、アクションはトリガーされたときに実行される操作を記述する辞書オブジェクトです。例えば、ページへのナビゲーション、アプリケーションの起動、フォームデータの送信などがあります。具体的なアクションクラスを直接インスタンス化するのではなく、PDActionFactoryはタイプ識別子(アクション辞書の「S」エントリ)に基づいてアクションオブジェクトを作成するための統一されたインターフェースを提供します。この抽象化レイヤーは、PDFアクションタイプ名とPDFBoxにおける対応するJavaクラス実装とのマッピングの複雑さを処理し、開発者が ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で概説されているPDF仕様に準拠した適切に初期化されたアクションオブジェクトを扱えるようにします。

全投稿を閲覧 gdoc_arrow_right_alt