Conversion decompression
変換時解凍(Conversion decompression)は、PDF文書のフォーマット変換または処理操作中に、フィルタ処理されたコンテンツストリームを解凍するプロセスです。PDF文書はファイルサイズを削減するために様々な圧縮フィルタを使用しており、コンテンツを他のフォーマットに変換したり文書構造を変更したりする際には、これらのフィルタを解凍する必要があります ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この操作は、圧縮されたストリーム内にエンコードされた実際のコンテンツデータにアクセスするために不可欠です。
変換時解凍は、PDFコンテンツを変換、抽出、または変形する必要がある際に発生する解凍ステップを特に指します。レンダリング時に発生する一般的なPDF解凍とは異なり、変換時解凍は、開発者がHTMLへの変換、テキスト抽出、文書構造の変形などの目的で生のコンテンツデータにアクセスする必要がある場合に発生します。
PDF仕様 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、FlateDecode、LZWDecode、DCTDecodeなど、複数のストリームフィルタタイプが定義されています。変換操作中は、基盤となるコンテンツオペレータ、テキスト文字列、画像データにアクセスするために、これらの圧縮されたストリームをデコードする必要があります。これは、表示可能なコンテンツのみが選択的に解凍される閲覧時のオンザフライ解凍とは異なります。
