Clipped image extraction
Clipped image extractionとは、PDF内の画像データを取得する際に、その画像が元の画像コンテンツの一部をマスクまたはトリミングするclipping pathと共に表示されている場合の処理を指します。
Clipped image extractionとは、PDF内の画像データを取得する際に、その画像が元の画像コンテンツの一部をマスクまたはトリミングするclipping pathと共に表示されている場合の処理を指します。PDFドキュメントでは、graphics stateで定義されたclipping pathによって、画像の基礎となるデータ自体を変更することなく、画像の可視領域を制限することができます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このような画像を抽出する際には、完全な画像を再構築するか、クリップされた領域の有効な境界を特定する必要があります。
Clipped image extractionとは、clipping pathによって画像の描画が制約されているPDFのcontent streamから画像を抽出することを指します。完全な画像をPDFのimage XObjectから直接取得できる単純な画像抽出とは異なり、clipped imageは可視部分が実際の画像データのサブセットのみを表している可能性があるため、追加の複雑さが生じます。Clipping pathはgraphics stateで定義されたマスクとして機能し、どのピクセルがレンダリングされるかを決定しますが、基礎となる画像リソースは通常、完全なクリップされていない画像データを含んでいます。これは、masked imageとは異なります。Masked imageでは、graphics stateのclipping機構ではなく、画像オブジェクトレベルで透明度やsoft maskが適用されます。
PDF処理ツールを構築する開発者にとって、clipped image extractionは正確なコンテンツ抽出とドキュメント解析において重要です。アーカイブ、変換、またはアクセシビリティ目的で画像を抽出する際に、clipping pathを考慮しないと、ドキュメント内で実際に可視だった部分だけでなく画像全体を抽出してしまい、誤ったコンテンツ表現につながる可能性があります。Clipped image extractionの理解は、ドキュメントの外観を忠実に再現する必要があるアプリケーション、PDFのアクセシブル版を生成するアプリケーション、または画像ベースのコンテンツに対して正確な光学文字認識を実行するアプリケーションにとって特に重要です。開発者は、使用ケースの要件に基づいて、完全な基礎画像を抽出するか、可視のクリップされた領域のみを再構築するかを決定する必要があります。
Clipped image extractionは、content stream内で画像がレンダリングされる時点でのgraphics state stackを解析することを含みます。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によると、graphics stateは、すべての描画操作と交差する現在のclipping pathを維持します。画像が描画される際、開発者は以下を行う必要があります:
- 画像レンダリングコマンド(
Doなど)に先行するcontent streamオペレーターを解析し、clipping path操作(W、W*、またはクリッピングを伴うshオペレーター)を識別する - 画像配置とclipping pathの座標の両方に影響する現在の変換行列(CTM)を決定する
- Clipping pathが可視画像領域を制限しているかどうかを評価する
- クリッピング領域に関するメタデータと共に完全な画像を抽出するか、クリップ境界を画像データに適用してトリミングされたバージョンを再構築する
再構築プロセスには、clipping pathを適用した画像のラスタライズ、またはクリップパスと画像境界の交差を計算して新しいトリミング画像を作成することが含まれる場合があります。複雑なシナリオには、複数のネストされたclipping pathや、任意のパスで定義された非矩形のクリッピング領域が含まれます。
- Content stream – ページまたはform XObjectの外観を記述するオペレーターとオペランドのシーケンス
- Graphics state – clipping path、変換行列、色空間など、レンダリングコンテキストを定義するパラメーターのコレクション
- Clipping path – コンテンツがレンダリングされる領域の境界を定義するパス
- Image XObject – ページ上に描画できる画像データを含むstreamオブジェクト
- Transformation matrix (CTM) – ユーザー空間座標をデバイス空間にマッピングする現在の変換行列
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
