Character code

概要

文字コード（Character code）は、PDFコンテンツストリーム内に出現する数値で、ページ上にレンダリングされる特定の文字を表します。PDFがテキストを表示する際、文字コードを使用して数値をフォントエンコーディング機構を通じてグリフにマッピングします ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。これらのコードは、PDFファイル内の数値データと、ドキュメントがレンダリングされたときに表示される可視文字との間の基本的な橋渡しを形成します。

定義

文字コードは、PDFコンテンツストリーム内のテキスト表示オペレータのオペランドとして出現する整数値です（単一バイトエンコーディングでは通常0～255の範囲、マルチバイトエンコーディングではそれ以上）。文字コード自体は、どのグリフを描画するかを直接指定するものではありません。代わりに、現在のフォントのエンコーディングシステムを通じて解釈される必要があるインデックスとして機能し、実際に表示する文字やグリフを決定します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。

全投稿を閲覧

Clipped image extraction

概要

Clipped image extractionとは、PDF内の画像データを取得する際に、その画像が元の画像コンテンツの一部をマスクまたはトリミングするclipping pathと共に表示されている場合の処理を指します。PDFドキュメントでは、graphics stateで定義されたclipping pathによって、画像の基礎となるデータ自体を変更することなく、画像の可視領域を制限することができます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このような画像を抽出する際には、完全な画像を再構築するか、クリップされた領域の有効な境界を特定する必要があります。

定義

Clipped image extractionとは、clipping pathによって画像の描画が制約されているPDFのcontent streamから画像を抽出することを指します。完全な画像をPDFのimage XObjectから直接取得できる単純な画像抽出とは異なり、clipped imageは可視部分が実際の画像データのサブセットのみを表している可能性があるため、追加の複雑さが生じます。Clipping pathはgraphics stateで定義されたマスクとして機能し、どのピクセルがレンダリングされるかを決定しますが、基礎となる画像リソースは通常、完全なクリップされていない画像データを含んでいます。これは、masked imageとは異なります。Masked imageでは、graphics stateのclipping機構ではなく、画像オブジェクトレベルで透明度やsoft maskが適用されます。

全投稿を閲覧

Clipping path

概要

クリッピングパスは、PDF コンテンツストリーム内で定義されるグラフィカルな境界であり、後続の描画操作がコンテンツを描画できる領域を制限します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。グラフィックス演算子によって作成されるマークのうち、クリッピングパス外に該当するものはページ上にレンダリングされません。線描や塗りつぶしに使用されるパスとは異なり、クリッピングパスはグラフィックス状態内でアクティブな描画領域を定義するマスキング機構としてのみ機能します。

定義

クリッピングパスは、PDF におけるレンダリング操作の領域境界を確立する特殊なタイプのパスオブジェクトです。通常のパスは線描（輪郭描画）や塗りつぶし（ソリッド塗装）が可能ですが、クリッピングパスはクリッピング演算子（W または W*）とともに使用され、後続のグラフィックス操作によってページのどの部分が描画可能かを定義します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。

全投稿を閲覧

ClosePath (h)

概要

ClosePath演算子（PDFコンテンツストリームではhコマンドで表される）は、現在のサブパスの開始点から現在の点まで直線セグメントを追加することで、現在のサブパスを閉じるパス構築演算子です。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) この演算子は、PDFグラフィックスにおいて多角形、矩形、その他の閉図形などの閉じた幾何学的形状を作成するために不可欠です。単に開始点まで線を引き戻すのとは異なり、ClosePath演算子はパスを明示的に閉じたものとしてマークします。これは、特に線端や線接合を使用してストロークする際のパスのレンダリング方法に影響します。

定義

ClosePath（h）は、PDFコンテンツストリームにおけるパス構築演算子で、現在の点からサブパスの開始点まで直線セグメントで接続することで現在のサブパスを終了します。この演算子はオペランドを取らず、この最終接続セグメントを追加してサブパスを明示的に閉じたものとしてマークすることで現在のパスを変更します。この区別は重要です。なぜなら、視覚的に閉じているように見えるパス（開始点まで手動で線を引いた場合）と、h演算子を使用して形式的に閉じられたパスは異なるためです。後者は、パスが閉じる点で、特にストローク時の線接合スタイルに関して、適切なレンダリング動作を保証します。

ClosePath演算子は、LineTo（l）などの他のパス構築演算子と異なり、線セグメントを描画するだけでなく、サブパスの状態を「閉じた」状態に変更します。サブパスが閉じたものとしてマークされると、PDFレンダラーはパスが閉じる接合部に線接合スタイル（マイター、ラウンド、またはベベル）を適用します。これは、2つの独立した線の端点で発生する線端スタイルの適用とは異なります。

重要性

PDF生成や操作を行う開発者にとって、ClosePath演算子の理解は、適切にレンダリングされる幾何学的形状を作成するために不可欠です。hを使用することで、閉図形が閉じる接合部を含むすべての頂点で一貫したストローク外観を持って正しく表示されることが保証されます。パスを明示的に閉じない場合、図形はパスの終点と開始点が出会う場所で、隙間や不一致な線端スタイルなどの視覚的なアーティファクトが発生する可能性があります。

全投稿を閲覧

Content stream

概要

コンテントストリームは、グラフィックスオペレータとそのオペランドのシーケンスを含むPDFストリームオブジェクトであり、ページ上またはフォームXObject内でコンテンツをどのように描画すべきかを定義します ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。これらのストリームは、テキスト、画像、ベクターグラフィックス、その他の視覚要素を描画するための特殊な描画コマンド言語を使用します。コンテントストリームはPDFのページ記述言語の中核を成し、構造化データをユーザーがPDF文書を閲覧する際に目にする視覚的表現に変換します。

定義

コンテントストリームは、グラフィカルコンテンツを記述するオペレータとオペランドのシーケンスを含む、バイナリまたはASCIIエンコードされたストリームオブジェクトです。構造やメタデータを定義する他のPDFオブジェクトとは異なり、コンテントストリームにはPDFレンダラーによって実行される実際の描画命令が含まれています。PDFの各ページには通常、その/Contentsエントリによって参照される少なくとも1つのコンテントストリームがありますが、ページは順次処理される複数のコンテントストリームを持つこともできます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。

全投稿を閲覧

CTM (Current Transformation Matrix)

概要

CTM（Current Transformation Matrix、現在の変換行列）は、PDFコンテンツストリームにおいて、ユーザー空間の座標をデバイス空間にマッピングする方法を定義する数学的構造です ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。CTMは、拡大縮小、回転、平行移動、傾斜など、グラフィックオブジェクトに適用されるすべての幾何学的変換を制御します。CTMはグラフィックス状態の一部であり、テキスト、パス、画像を描画する際に使用されるすべての座標に影響を与えます。

定義

CTMは、ユーザー空間（グラフィックス操作を指定する際に使用される座標系）からデバイス空間（出力デバイスの座標系）へ座標を変換する3×3行列です。PDFでは、この行列は6つの数値 [a b c d e f] で表現され、変換行列の最初の2行に対応します。3行目は常に [0 0 1] であるためです ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。

全投稿を閲覧

CurveTo (c)

概要

CurveTo演算子（PDF構文ではcと表記）は、PDFコンテンツストリーム内で現在のパスに3次ベジェ曲線セグメントを追加するパス構築コマンドです。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、この演算子は3つの制御点を使用して、現在の点から新しい終点までの滑らかな曲線を定義します。これは、複雑なベクトル図形を作成するためにPDFグラフィックスストリームで利用可能な複数の曲線描画演算子の1つです。

定義

CurveTo（c）演算子は、PDFパスオブジェクト内で3次ベジェ曲線を構築する低レベルのグラフィックスコマンドです。この演算子は、3つの座標ペア（x₁, y₁, x₂, y₂, x₃, y₃）を表す6つの数値パラメータを取ります。最初の2つの点は曲線の形状に影響を与える制御点として機能し、3番目の点は曲線の終点となり、新しい現在の点となります。単純な直線描画演算子とは異なり、CurveToは、タイポグラフィのアウトラインから複雑なイラストレーションまで、あらゆるものを表現できる滑らかで数学的に正確な曲線の作成を可能にします。

この演算子は、v（最初の制御点を省略）やy（2番目の制御点を省略）などの類似の曲線演算子とは異なり、3つの制御点すべてを明示的に指定する必要があります。これにより、cはPDFの3次ベジェ曲線演算子の中で最も柔軟性が高い反面、最も冗長なものとなっています。

重要性

PDF生成や操作を行う開発者にとって、CurveTo演算子の理解はベクトルグラフィックスコンテンツの作成や解釈に不可欠です。チャートのレンダリング、CAD図面、フォントレンダリング、グラフィックデザインツールなど、PDFグラフィックスを生成するあらゆるライブラリは、CurveToを含むパス構築演算子を実装する必要があります。既存のPDFを解析する際には、この演算子を認識して正しく解釈することが、正確なレンダリング、コンテンツ抽出、またはフォーマット変換にとって重要です。

全投稿を閲覧

Fill (f)

概要

fill演算子（f）は、PDFコンテンツストリームにおける基本的なパス描画演算子であり、非ゼロワインディング数規則を使用して現在のパスの内部を塗りつぶします。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 中核的なグラフィックス演算子の一つとして、パスで囲まれた領域に現在の塗りつぶし色を適用し、PDF文書内の図形、テキスト、ベクターグラフィックスのレンダリングに不可欠です。この演算子は現在のパスを消費します。つまり、塗りつぶし操作が完了した後、パスはクリアされます。

定義

f演算子は、非ゼロワインディング数規則を使用して、現在のパスで囲まれた領域を塗りつぶすコンテンツストリームコマンドです。この規則により、複雑なパスや自己交差するパスを扱う際に、どの領域がパスの「内側」と見なされるかが決定されます。f演算子はf*（偶奇規則による塗りつぶし）演算子とは、パスの内部を計算する方法が異なります。f演算子はF演算子（大文字）と同等であり、どちらも同じ非ゼロワインディング数規則を実装しています。実行されると、グラフィックス状態から現在の塗りつぶし色をすべての内部領域に適用し、その後、現在のパスをメモリからクリアします。ストローク演算子（Sなど）とは異なり、fill演算子はパスの輪郭に沿って描画するのではなく、囲まれた空間を色で塗りつぶします。

重要性

PDF生成または操作を行う開発者にとって、fill演算子を理解することは、図形やベクターグラフィックスを正しくレンダリングするために不可欠です。f（非ゼロワインディング）とf*（偶奇規則）の選択は、重なり合うパスや自己交差するパスのレンダリング方法に影響し、複雑なグラフィックスの視覚的出力に影響を与えます。プログラムによってPDFコンテンツストリームを作成する際、開発者はfill演算子を適用する前に、m（moveto）、l（lineto）、c（curveto）などの演算子を使用してパスを構築する必要があります。fill演算子の適切な使用は、PDFアクセシビリティやTagged PDF実装においても重要です。塗りつぶされた領域は、論理構造要素と適切に関連付けられる必要がある視覚的プレゼンテーション層に寄与するためです。 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ )

全投稿を閲覧

Form XObject

概要

Form XObjectは、PDF内で自己完結型の再利用可能なコンテンツストリームであり、コンテンツを複製することなく文書全体で複数回呼び出すことができます。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、PDFグラフィックスオペレータを含むストリームオブジェクトと、独自のリソースディクショナリおよび座標空間を定義するバウンディングボックスで構成されています。Form XObjectは、複雑なグラフィカルコンテンツを一度定義し、必要な場所で参照できるようにすることで、効率的な文書構造を実現します。

定義

Form XObjectは、独自の独立したグラフィックス状態とリソースを持つ完全なコンテンツストリームをカプセル化する、PDF内の特殊なタイプの外部オブジェクト（XObject）です。ページのコンテンツストリームに直接埋め込まれるインラインコンテンツとは異なり、Form XObjectは/Subtypeが/Formである独立したストリームオブジェクトとして定義され、Doオペレータを使用して呼び出すことができます。フォント、画像、その他のアセット用の独自の/Resourcesディクショナリと、内部座標系を確立する/BBox（バウンディングボックス）配列を含んでいます。Form XObjectは、ラスター画像データではなくベクターグラフィックスとテキストオペレータを含む点でImage XObjectとは異なり、独自の変換マトリックスとクリッピング境界を持つ再利用可能な独立ユニットである点で通常のコンテンツストリームとは異なります。

重要性

PDFの生成と操作に携わる開発者にとって、Form XObjectは効率的でメンテナンス性の高い文書を作成するために不可欠です。ロゴ、ヘッダー、フッター、透かしなど、同じコンテンツが複数回表示される場合、コンテンツを一度保存して複数回参照することでファイルサイズを大幅に削減できます。Form XObjectは、複雑なグラフィカル要素を独立して管理できるモジュラーユニットとしてカプセル化することで、文書構造とメンテナンス性も向上させます。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で参照されているTagged PDFのアクセシビリティ機能にとって特に重要であり、Form XObjectを適切にタグ付けして文書の論理構造に統合できます。さらに、透明グループ、オプショナルコンテンツ（レイヤー）などの高度な機能を可能にし、PDFプロセッサが解析されたコンテンツをキャッシュして再利用できるようにすることで効率的なレンダリングを実現します。

全投稿を閲覧

Graphics state

概要

グラフィックステート（graphics state）は、PDFページ上でコンテンツがどのように描画されるかを制御するレンダリングパラメータの集合です ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。ストロークと塗りつぶしの色、線の幅、破線パターン、現在の変換マトリックス（CTM）などの設定が含まれます。グラフィックステートはスタックベースのシステムとして動作し、開発者がコンテンツストリーム内で複雑な視覚要素を構築する際に、レンダリング設定を保存および復元できるようにします。

定義

グラフィックステートは、PDFにおいてグラフィックスオペレータがコンテンツを描画する方法に影響を与える、デバイス非依存のグラフィックス制御パラメータの完全なセットを表します。これらのパラメータには、色の指定（ストロークと塗りつぶしの両方）、線の属性（幅、端点スタイル、結合スタイル、破線パターン、マイター制限）、テキストレンダリングプロパティ（フォント、サイズ、文字間隔、水平スケーリング）、ユーザー空間座標をデバイス空間にマッピングする現在の変換マトリックス、クリッピングパス、およびさまざまなレンダリングインテント設定が含まれます。フォントや画像などの名前で参照されるページレベルのリソースとは異なり、グラフィックステートパラメータはコンテンツストリームの実行環境の一部としてアクティブに維持され、すべての描画操作に直接影響を与えます。

重要性

グラフィックステートの理解は、PDFコンテンツをプログラム的に生成、操作、またはレンダリングする開発者にとって不可欠です。PDFコンテンツストリームを作成する際、開発者は視覚要素が正しく表示されるようにグラフィックステートパラメータを適切に管理する必要があります。不適切な色空間、変換マトリックス、または線幅は、コンテンツの歪みや不可視化を引き起こす可能性があります。グラフィックステートのスタックベースの性質により、レンダリングコンテキストを効率的に管理でき、開発者は周囲のコンテンツに影響を与えることなく特定の描画操作に対する変更を分離できます。アクセシビリティとTagged PDFの実装において、適切なグラフィックステート管理を維持することで、異なるビューアや支援技術間で視覚コンテンツが一貫してレンダリングされることが保証され、これはPDF/UA要件を満たすために重要です ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 。

全投稿を閲覧