Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Embedded file

Embedded fileとは、PDFドキュメント内に独立したデータストリームとして保存される、完全な非PDFファイルです。

カテゴリ: General PDF Concepts
キーワード: embedded file, Embedded file

概要

Embedded fileとは、PDFドキュメント内に独立したデータストリームとして保存される、完全な非PDFファイルです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、embedded filesによってPDFドキュメントは複数のファイルタイプのコンテナとして機能し、ユーザーはソースデータ、補足ドキュメント、マルチメディアファイルなどの関連アセットを、主要なPDFコンテンツと共にパッケージ化できます。この機能により、PDFは単純なドキュメント形式から、関連ファイル間の関係性を維持するポータブルアーカイブへと変化します。

定義

Embedded fileとは、PDFの内部構造に保存されるバイナリファイルストリームであり、PDFの可視ページコンテンツとは区別されます。電子メールシステムの添付ファイルとは異なり、embedded filesはPDFファイル自体の不可欠な部分となり、全体のファイルサイズは増加しますが、関連ファイルが単一のユニットとして一緒に移動することを保証します。PDF仕様では、embedded file streamsは、元のファイル名、MIMEタイプ、作成日、変更日などのメタデータと共に実際のファイルデータを含む辞書オブジェクトとして定義されています。

Embedded filesは、同じくPDF内に保存されるインライン画像やフォントとは異なります。これらはドキュメントの視覚的表示の一部として直接レンダリングされますが、embedded filesは、ユーザーがPDFビューアの添付ファイルパネルやアノテーションを通じて明示的にアクセスするまで休止状態のままです。Embedded filesは元のファイル形式を維持し、PDFコンテナから独立して抽出および使用できます。

重要性

PDF生成および処理を行う開発者にとって、embedded filesはいくつかの実用的な利点を提供します。外部ファイル参照やネットワーク上の場所に依存しない自己完結型のドキュメントパッケージの作成を可能にし、これはアーカイブコンプライアンスや長期的なドキュメント保存において重要です。これは特に、すべての補足ドキュメントを含む完全な記録の維持が求められる規制環境において重要です。

Embedded filesはまた、生成されたレポートにソースデータを添付する必要があるワークフローを促進します。例えば、財務PDFレポート内に元のスプレッドシートを埋め込んだり、建築ドキュメント内にCADファイルを含めたりする場合です。ドキュメント管理システムを構築する開発者にとって、embedded filesの理解は、ファイル抽出、ドキュメント完全性の検証、レガシードキュメントパッケージの最新システムへの移行などの機能を実装するために不可欠です。

仕組み

Embedded filesは、PDFのファイル仕様辞書構造を通じて実装されます。各embedded fileは、EmbeddedFiles名前ツリー内のエントリを必要とするか、PDFページ上の特定のアノテーションまたはファイル添付アノテーションに付加できます。Embedded file streamオブジェクトには実際のファイルデータが含まれ、サイズへの影響を最小限に抑えるために標準的なPDF圧縮方法を使用して圧縮される場合があります。

技術的な実装には、いくつかの主要なコンポーネントが含まれます:embedded fileを記述するファイル仕様辞書、実際のデータを含むembedded file stream、および検証用の圧縮フィルターやチェックサム値などのオプションパラメータです。開発者は、PDFライブラリを通じて、ドキュメントの名前ツリー構造をトラバースするか、ファイル添付アノテーションをクエリすることで、プログラム的にembedded filesにアクセスできます。Embedded filesを抽出する際、元のファイル名とMIMEタイプのメタデータが、抽出されたコンテンツの適切な処理と保存を導きます。

PDFビューアは通常、専用の添付ファイルパネルにembedded filesを表示し、ユーザーはこれらのファイルを開く、保存する、または抽出することができます。開発の観点からは、embedded filesの作成には、ソースファイルデータをstreamオブジェクトにエンコードし、PDFのカタログ構造内に適切に登録することが必要です。一方、抽出はこのプロセスを逆にし、streamを特定し、必要に応じて解凍し、生データをディスクに書き込みます。

関連用語

  • File specification – 埋め込みまたは外部のファイル参照を記述する辞書
  • Stream object – 画像やembedded filesなどのバイナリコンテンツを保存するために使用される基本的なPDFデータ構造
  • Name tree – 文字列名をオブジェクトにマッピングするPDF内の組織構造で、embedded filesの管理に使用される
  • Annotation – 添付ファイルを参照できるPDFページ上のインタラクティブ要素
  • PDF Package – カスタムインターフェースで複数のembedded filesを提示するように設計された特殊なPDFドキュメント

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html