Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

区切り文字(Delimiter character)

概要

区切り文字(Delimiter character)は、PDF構文において異なる構文要素やトークン間の境界を示す特殊文字です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、これらの文字には、スラッシュ(/)、山括弧(< >)、角括弧([ ])、丸括弧(( ))、波括弧({ })が含まれます。区切り文字は、オブジェクト、名前、文字列、その他のデータ型を明確に分離することで、PDFファイル構造の解析において重要な役割を果たします。

定義

区切り文字とは、PDFファイル構造内のトークンを分離または囲むために使用される、PDF構文における特定の文字セットです。区切り文字の完全なセットは、スラッシュ(/)、小なり記号(<)、大なり記号(>)、左角括弧([)、右角括弧(])、左丸括弧(()、右丸括弧())、左波括弧({)、右波括弧(})で構成されます。

トークンを分離する役割を持つ空白文字(スペース、タブ、改行など)が多くの場合省略可能であるのに対し、区切り文字は構文上重要であり、特定の文脈で必須となります。例えば、スラッシュ(/)はすべての名前オブジェクトの前に付けなければならず、丸括弧はリテラル文字列を囲む必要があります。区切り文字は通常のデータ文字とは異なり、特別なエンコーディングやエスケープ処理なしには特定のトークン内に含めることができません。

一部の区切り文字はペアで動作し(丸括弧、角括弧、山括弧など)、データ構造を囲みますが、他の文字(スラッシュなど)はマーカーとして独立して機能します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、これらの文字はPDFの字句構造の基本であり、すべてのPDFパーサーで認識される必要があります。

全投稿を閲覧 gdoc_arrow_right_alt

字句規則(Lexical conventions)

概要

字句規則(Lexical conventions)は、PDF構文内で文字がどのように解釈され、意味のある単位に組織化されるかを定める基本的なルールです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、これらの規則はトークンの構造、区切り文字の使用、コメント構文、および空白文字の処理を管理します。字句規則を理解することは、PDFファイルを正しく解析および生成するために不可欠です。なぜなら、これらはすべての高レベルPDFオブジェクトが構築される基盤を形成するからです。

定義

字句規則は、PDFファイルが文字およびトークンレベルでどのように構造化されるかを定める低レベルの構文規則です。これらの規則は、PDFパーサーが個々の文字をどのように解釈し、それらをトークン(名前、数値、文字列、キーワードなどのPDF構文の基本的な字句単位)にグループ化するかを指定します。規則はまた、区切り文字として機能する特殊文字(括弧、角括弧、山括弧など)を定義し、コメントのフォーマット方法(%文字で始まり行末まで続く)を確立し、どの文字が空白文字を構成するか(スペース、タブ、キャリッジリターン、ラインフィード、ヌル、フォームフィード)を決定します。オブジェクトやコンテンツストリームなどの高レベルPDF構造とは異なり、字句規則は最も基本的な解析レベルで動作し、従来のプログラミング言語コンパイラにおける字句解析フェーズに相当します。

重要性

PDF生成または解析ライブラリを扱う開発者にとって、字句規則を理解することはいくつかの理由で重要です。第一に、これらの規則は、PDFファイルを書き込む際にコードがデータをどのようにフォーマットする必要があるかを決定します。不適切な間隔、誤った区切り文字の使用、または不正なトークンは、リーダーが処理できない無効なPDFを生成します。第二に、PDFパーサーやバリデーターを実装する際、字句規則は、意味解析が行われる前に実装されなければならないトークン化ロジックを定義します。第三に、PDF関連の問題をデバッグするには、生のPDF構文を調査する必要があることが多く、字句規則に精通していれば、開発者は区切り文字の欠落、不適切なコメント構文、無効なトークン形式などの構造的問題を迅速に特定できます。最後に、JavaやJavaScriptなどの言語でPDFライブラリを使用する場合、これらの規則を理解することで、開発者は特定の文字列エスケープやエンコーディング手法がなぜ必要なのかを認識できるようになります。

全投稿を閲覧 gdoc_arrow_right_alt

数値オブジェクト(Numeric object)

概要

数値オブジェクトは、整数と実数の両方を含む数値を表現するPDFの基本的なデータ型です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、数値オブジェクトはPDF文書全体で使用され、座標、寸法、変換マトリックス、色値、および文書のレンダリングと動作を制御する様々なパラメータを指定します。これらのオブジェクトは、PDFがページコンテンツとレイアウトを正確に記述するための数学的基盤を形成します。

定義

PDFにおける数値オブジェクトは、標準化された形式で記述された整数または実数(浮動小数点数)を表現するプリミティブデータ型です。整数の数値オブジェクトは1つ以上の数字で構成され、オプションでプラス記号またはマイナス記号を前に付けることができます(例:42-17+123)。実数の数値オブジェクトは小数点を含み、標準的な10進表記(例:3.14-2.50.001)または、サポートされている場合は指数表記で記述できます。整数型と浮動小数点型を異なるデータ構造で区別するプログラミング言語とは異なり、PDFでは両方を同じ構文カテゴリ内の数値オブジェクトとして扱いますが、コンテキストに応じて処理方法が異なる場合があります。

数値オブジェクトは、文字列オブジェクト(テキストを表現)や名前オブジェクト(識別子として機能)とは異なります。文字列が「123」という文字を含む場合、これは数学的な値ではなくテキストを表現します。数値オブジェクトは常に、数学的演算や比較に参加できる量として解釈されます。

重要性

PDF生成、操作、またはレンダリングに取り組む開発者にとって、数値オブジェクトの理解は不可欠です。なぜなら、これらはPDF文書の視覚的および構造的側面を制御するためです。PDFの座標系における座標は、数値オブジェクトを使用してテキストとグラフィックをサブピクセル精度で配置します。また、変換マトリックスは6つの数値を使用してコンテンツの拡大縮小、回転、平行移動を行います。色値、線幅、フォントサイズ、ページ寸法はすべて、その仕様に数値オブジェクトを使用しています。

全投稿を閲覧 gdoc_arrow_right_alt