Clipped image extraction
Clipped image extractionとは、PDF内の画像データを取得する際に、その画像が元の画像コンテンツの一部をマスクまたはトリミングするclipping pathと共に表示されている場合の処理を指します。PDFドキュメントでは、graphics stateで定義されたclipping pathによって、画像の基礎となるデータ自体を変更することなく、画像の可視領域を制限することができます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このような画像を抽出する際には、完全な画像を再構築するか、クリップされた領域の有効な境界を特定する必要があります。
Clipped image extractionとは、clipping pathによって画像の描画が制約されているPDFのcontent streamから画像を抽出することを指します。完全な画像をPDFのimage XObjectから直接取得できる単純な画像抽出とは異なり、clipped imageは可視部分が実際の画像データのサブセットのみを表している可能性があるため、追加の複雑さが生じます。Clipping pathはgraphics stateで定義されたマスクとして機能し、どのピクセルがレンダリングされるかを決定しますが、基礎となる画像リソースは通常、完全なクリップされていない画像データを含んでいます。これは、masked imageとは異なります。Masked imageでは、graphics stateのclipping機構ではなく、画像オブジェクトレベルで透明度やsoft maskが適用されます。
