Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDF optimization on-premise

PDF optimization on-premiseとは、クラウドベースのサービスではなく、ローカルインフラストラクチャ上で実行される、さまざまな圧縮および再構築技術を通じてPDFファイルサイズを削減し、ドキュメントのパフォーマンスを向上させるプロセスを指します。

カテゴリ: General PDF Concepts
キーワード: pdf optimization on-premise, PDF optimization on-premise

概要

PDF optimization on-premiseとは、クラウドベースのサービスではなく、ローカルインフラストラクチャ上で実行される、さまざまな圧縮および再構築技術を通じてPDFファイルサイズを削減し、ドキュメントのパフォーマンスを向上させるプロセスを指します。このアプローチにより、組織は ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義された標準的なPDF最適化戦略を実装しながら、機密性の高いドキュメント処理を完全に制御できます。On-premise最適化は、機密データを扱う企業、規制業界、厳格なデータガバナンス要件を持つ組織にとって特に重要です。

定義

PDF optimization on-premiseとは、組織自身のコンピューティング環境内(ローカルサーバー、プライベートデータセンター、または自己ホスト型インフラストラクチャ)でPDFファイルサイズの削減とパフォーマンス向上の操作を実行する手法です。これは、ドキュメントを外部サーバーにアップロードして処理するクラウドベースのPDF最適化サービスとは異なります。

最適化プロセスには複数の技術が含まれます:重複リソースの削除、画像の圧縮、使用されている文字のみを含むフォントのサブセット化、未使用オブジェクトの除去、そしてより高速なレンダリングのための内部PDF構造の再構築です。技術的な最適化手法はPDF仕様標準 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) と一致していますが、on-premiseアプローチでは、ドキュメントが組織の管理環境外に出ることがないことを保証します。

このアプローチは、データの局所性、セキュリティ制御、インフラストラクチャの所有権という点で、クラウドベースの最適化サービスとは対照的です。組織は自社のハードウェア上にPDFライブラリ、SDK、またはスタンドアロンの最適化ツールを展開し、ドキュメント処理ワークフローに対する完全な主権を維持します。

重要性

機密性の高いドキュメントを扱う開発者にとって、on-premise PDF最適化は重要な利点を提供します。医療、金融、法律、政府機関などの組織は、機密ドキュメントをサードパーティサービスに送信することを禁止する規制要件(HIPAA、GDPR、SOX)に直面することがよくあります。ローカルで最適化を実装することで、必要なファイルサイズの削減を達成しながらコンプライアンスを確保できます。

On-premiseソリューションは、大きなドキュメントをクラウドサービスにアップロードする際の遅延や帯域幅の問題も排除します。バッチ操作で数千のPDFを処理する場合、ローカル処理は予測可能なパフォーマンスを提供し、ネットワークのボトルネックを回避します。さらに、組織はクラウドサービスの継続的なサブスクリプションコストを回避し、外部サービスの可用性から独立性を維持できます。

開発者にとって、これはPDF最適化ライブラリをアプリケーションに直接統合することを意味します—iTextやApache PDFBoxなどのライブラリを使用するJavaアプリケーション、同様のフレームワークを使用する.NETアプリケーション、またはドキュメント管理ワークフローの一部としてドキュメントを処理するサーバーサイド実装などです。この実装には、PDF最適化技術とライセンス、セキュリティ強化、パフォーマンスチューニングなどのエンタープライズ展開の考慮事項の両方を理解する必要があります。

仕組み

On-premise PDF最適化は、PDF構造に適用されるいくつかの技術的プロセスを通じて動作します。オプティマイザは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているドキュメントの内部オブジェクト構造を分析し、ターゲットを絞った圧縮戦略を適用します。

オブジェクトストリーム圧縮は、複数の小さなPDFオブジェクトを圧縮されたストリームに統合し、オブジェクトヘッダーと相互参照テーブルからのオーバーヘッドを削減します。画像の再圧縮は、適切な圧縮アルゴリズム(写真にはJPEG、スクリーンショットにはFLATE)を適用し、ターゲット解像度要件を超える画像をダウンサンプリングします。

フォントサブセット化は、埋め込まれたフォントから未使用のグリフを削除し、フォントの文字セットのごく一部のみを使用するドキュメントでは、フォントデータを90%以上削減することがよくあります。コンテンツストリームの最適化は、冗長な演算子を削除し、グラフィックス状態の変更を統合し、不可視のコンテンツを排除します。

リニアライゼーションは、高速なWeb表示のためにPDFを再構築し、最初のページのオブジェクトをファイルの先頭に配置して、プログレッシブレンダリングを可能にします。このプロセスは、Tagged PDF ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) のアクセシビリティ機能を含む、ドキュメントの忠実性と構造の整合性を維持します。

開発者は、アプリケーションサーバーまたはバッチ処理システムにインストールされたPDF処理ライブラリを通じて、これらの機能を統合します。ソフトウェアはソースPDFを読み取り、構成可能なパラメータ(圧縮レベル、画質しきい値、フォントサブセット化ルール)で最適化アルゴリズムを適用し、最適化された出力ファイルを書き込みます—すべてセキュアなon-premise環境内で行われます。

関連用語

  • PDF compression – さまざまなエンコードと最適化手法を通じてPDFファイルサイズを削減する技術
  • Linearized PDF – Webブラウザでのプログレッシブダウンロードとページごとの表示のために再構築されたPDFファイル
  • Font subsetting – 完全なフォントファイルではなく、ドキュメントで実際に使用されている文字のみを埋め込むプロセス
  • Tagged PDF( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で説明されているアクセシビリティ情報を含む構造化されたPDFドキュメント
  • PDF processing library – プログラムによるPDFの作成、変更、最適化を可能にするソフトウェア開発キット

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html