Conversion compression
Conversion compressionとは、コンテンツをPDF形式に変換する際に圧縮アルゴリズムを適用するプロセスを指します。
Conversion compressionとは、コンテンツをPDF形式に変換する際に圧縮アルゴリズムを適用するプロセスを指します。他のドキュメント形式からPDFを生成する場合や、プログラムでPDFを作成する際に、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された仕様に従ってドキュメントの忠実性を維持しながらファイルサイズを削減するために圧縮技術が適用されます。このプロセスは作成後の圧縮とは異なり、PDF生成ワークフローの不可欠な一部として実行されます。
Conversion compressionとは、コンテンツがPDF構造に変換される時点で圧縮アルゴリズムを適用することであり、別個の後処理ステップとして実行されるものではありません。PDF作成時には、テキストストリーム、画像、フォント、メタデータなど、さまざまなコンテンツタイプが、PDF仕様でサポートされているFlate(ZIP)、LZW、JPEG、JBIG2などのアルゴリズムを使用して圧縮されます。これは、完成したPDFをzip圧縮するようなファイルレベルの圧縮や、PDF作成後に実行される最適化とは異なります。圧縮はオブジェクトがPDF構造に書き込まれる際に行われるため、変換プロセス自体に組み込まれた一部となります。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準に準拠したアクセシブルなPDFを作成する場合、conversion compressionは、アクセシビリティに不可欠な論理構造とタグ情報を保持するよう慎重に適用する必要があります。
PDF生成システムを構築する開発者にとって、conversion compressionを理解することはいくつかの理由から重要です。第一に、アプリケーションのパフォーマンスに直接影響します。変換中にコンテンツを圧縮することは、冗長な読み書き操作を回避できるため、通常、後処理よりも効率的です。第二に、ファイルサイズ管理を通じてエンドユーザー体験に影響します。小さなPDFはより速く読み込まれ、帯域幅の消費が少なく、必要なストレージも少なくなります。第三に、変換中に適切な圧縮方法を選択することで、特に画像やグラフィックスにおいて、非可逆圧縮と視覚的忠実性のバランスを取る必要がある場合に、ドキュメント品質を維持するのに役立ちます。最後に、conversion compressionを適切に実装することで、 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で要求される構造要素が損なわれずアクセス可能な状態を保つことができ、これはアクセシビリティ標準への準拠に不可欠です。
Conversion compressionは、PDF生成時にコンテンツタイプを分析し、各オブジェクトストリームをPDFファイル構造に書き込む前に適切な圧縮アルゴリズムを適用することで動作します。テキストコンテンツは通常Flate圧縮を使用します。これは文字データを保持し、Tagged PDF構造との互換性を維持するのに最適な可逆圧縮を提供します。画像データは、写真にはJPEG圧縮(非可逆)を使用し、エッジが鋭いグラフィックスにはFlate/LZW(可逆)を使用する場合があります。PDFライターは、ストリーム辞書で指定された圧縮フィルターを使用してオブジェクトをエンコードする必要があります。たとえば、Flate圧縮の場合は/Filter /FlateDecodeを使用します。このプロセス中に、圧縮パラメータを調整できます。たとえば、JPEGの品質レベルやFlate圧縮レベルを調整して、ファイルサイズと処理時間および出力品質のバランスを取ることができます。最近のPDFライブラリは通常、開発者がグローバルまたはコンテンツタイプごとに圧縮設定を指定できる設定オプションを提供しており、多くの意思決定を自動化しながらも、必要に応じて細かい制御を提供します。
- Stream compression – PDF仕様で定義されたフィルターを使用して個々のPDFオブジェクトストリームを圧縮する技術
- PDF optimization – PDFコンテンツを分析して再圧縮し、ファイルサイズを削減する作成後のプロセス
- Content stream – 作成時に圧縮可能なページコンテンツ命令を含むPDFオブジェクト
- Lossless compression – テキストのconversion compressionで一般的に使用される、元のデータを完全に保持するFlateなどの圧縮方法
- Filter – ストリームデータに適用される圧縮またはエンコードアルゴリズムを指定するPDFオブジェクトプロパティ
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
