Array object
配列オブジェクトは、PDF文書における基本的なデータ構造の1つであり、角括弧`[ ... ]`で囲まれたPDFオブジェクトの順序付きコレクションを表します。
配列オブジェクトは、PDF文書における基本的なデータ構造の1つであり、角括弧[ ... ]で囲まれたPDFオブジェクトの順序付きコレクションを表します。配列には、数値、文字列、名前、辞書、さらには他の配列など、あらゆる種類のPDFオブジェクトの組み合わせを含めることができ、PDF構造内で関連するデータを整理するために不可欠です
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。配列内の要素の順序は重要であり、文書のライフサイクル全体を通じて維持されます。
PDFにおける配列オブジェクトは、左右の角括弧([と])で区切られたPDFオブジェクトの1次元シーケンスであり、個々の要素は空白文字で区切られます。キーと値のペアを使用する辞書とは異なり、配列はゼロベースの位置インデックスによってアクセスされます。配列は異種混在型であり、1つの配列に制限なく異なる型のPDFオブジェクトを含めることができます。例えば、[549 3.14 false (Ralph) /SomeName]は、整数、実数、真偽値、文字列、名前オブジェクトを含む有効な配列です。配列はネストして多次元データ構造を作成することができ、空の配列[ ]も許可されています
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
PDF生成、操作、または解析を行う開発者にとって、配列オブジェクトの理解は非常に重要です。なぜなら、配列はPDF文書全体の重要な場面で使用されているからです。配列は、ページ境界(MediaBox、CropBox)の定義、グラフィックス操作の変換行列の指定、カラーコンポーネントの格納、ページコンテンツストリームのリスト化、Tagged PDF文書における構造要素の整理などに使用されます ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。PDF処理ツールやライブラリを構築する際、配列の適切な処理(内容の解析、要素順序の維持、PDF構文への正確なシリアライズを含む)は、文書の整合性にとって不可欠です。配列構造の誤った処理は、レンダリングエラー、不正確なページ寸法、または構造ツリーの破損につながる可能性があります。
配列オブジェクトは、要素の順序を保持するコンテナとして機能します。PDFプロセッサは開始角括弧に遭遇すると、終了角括弧に到達するまでオブジェクトを収集し、メモリ内に配列構造を作成します。配列内の各要素は、その位置によって参照でき、最初の要素はインデックス0にあります。配列には、実用的なメモリ制約を超える固有のサイズ制限はなく、任意の深さまでのネストをサポートします。PDF構文では、配列要素は空白文字(スペース、タブ、または改行)で区切られ、カンマやその他の区切り文字は使用されません。配列が間接オブジェクト参照を含む場合、それらの参照は保持され、配列がPDFファイル内の他の場所で定義されたオブジェクトを指すことができます。PDF仕様では、さまざまな目的のために特定の配列構造を定義しており、例えば、左下と右上の座標を使用して矩形領域を定義する4要素の矩形配列[llx lly urx ury]などがあります
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
。
- Dictionary object(辞書オブジェクト) – PDFデータを整理するために名前オブジェクトをキーとして使用する、キーと値のペアのコレクション
- Indirect object(間接オブジェクト) – PDF文書内の複数の場所から参照できるラベル付きオブジェクト
- Rectangle(矩形) – 矩形境界を定義する4つの数値を含む特定の配列形式
- Content stream(コンテンツストリーム) – パラメータとして配列オブジェクトを含むことがあるPDFオペレータとオペランドのシーケンス
- Structure tree(構造ツリー) – 親子関係を定義するために配列を使用する、タグ付きコンテンツ要素の階層構造
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
