Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDF stream SDK

PDF stream SDKは、で定義されているPDF文書内の基本的なデータ構造であるPDFストリームオブジェクトへのプログラマティックなアクセスを提供するソフトウェア開発キットです。

カテゴリ: General PDF Concepts
キーワード: pdf stream sdk, PDF stream SDK

概要

PDF stream SDKは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDF文書内の基本的なデータ構造であるPDFストリームオブジェクトへのプログラマティックなアクセスを提供するソフトウェア開発キットです。これらのSDKにより、開発者はPDFファイル内のコンテンツストリーム、画像データ、フォント、その他の圧縮またはエンコードされたコンテンツを構成するバイナリデータシーケンスの読み取り、書き込み、操作、処理が可能になります。Stream SDKは、低レベルのPDF構文の複雑さを抽象化しながら、PDF文書を構成する基盤となるデータ構造を直接操作するために必要なツールを提供します。

定義

PDF stream SDKは、PDFストリームオブジェクト(任意の長さを持つバイトシーケンスで、通常は圧縮またはエンコードされています)の処理に特化した専門的なツールキットです。ページの追加やフォームの入力などの高レベルな文書操作を重視する一般的なPDFライブラリとは異なり、ストリーム指向のSDKは、PDFデータ構造の中核を形成するバイナリコンテンツへの詳細なアクセスを提供します。これらのSDKは、さまざまなPDFフィルタ(FlateDecodeDCTDecodeASCII85Decodeなど)用のパーサー、デコーダー、エンコーダーを実装し、ストリーム辞書へのアクセス、生データまたはデコードされたデータの抽出、新しいストリームオブジェクトの書き込みを行うためのAPIを提供します。より広範なPDF操作ライブラリとの違いは、文書レベルの抽象化ではなく、直接的なストリームレベルの操作に焦点を当てている点にあり、PDF要素を構成する生のコンテンツを扱う必要がある開発者にとって不可欠なツールとなっています。

重要性

PDF処理アプリケーションを構築する開発者にとって、ストリームの理解と操作は非常に重要です。なぜなら、ストリームにはPDF文書の実際のコンテンツ、つまりコンテンツストリーム内のテキストやグラフィックスオペレーター、埋め込まれた画像やフォントのバイナリデータなどが含まれているからです。 ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で説明されているTagged PDF構造の実装などのアクセシビリティ機能を扱う際、開発者は支援技術のためにコンテンツを適切に抽出・分析するために、しばしばストリームレベルのアクセスを必要とします。Stream SDKは、コンテンツ抽出、PDFの修復と最適化、カスタムレンダリングエンジン、デジタルフォレンジック、特殊なフィルタや圧縮スキームの実装などのタスクにおいて特に重要です。適切なストリーム処理機能がなければ、開発者はPDFコンテンツストリームを効果的に解析したり、画像データを解凍したり、PDFコンテンツのレンダリングと解釈方法を決定する低レベル構造を理解したりすることができません。

仕組み

PDF stream SDKは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているストリームオブジェクト構造へのプログラマティックなインターフェースを提供することで動作します。この構造は、辞書、その後に続く「stream」キーワード、バイトシーケンス本体、そして「endstream」キーワードで構成されています。SDKは通常、ストリーム辞書を解析して長さ、フィルタ、デコードパラメータなどのメタデータを抽出し、適切な解凍とデコードアルゴリズムを適用して生データにアクセスするためのコンポーネントを含んでいます。ストリームの書き込み時には、SDKがエンコード、圧縮、ストリーム構造の適切なフォーマット処理を行います。主要な機能には、フィルタチェーン処理(複数のフィルタが順次適用される場合)、ストリーム辞書の操作、長さの計算と検証、大きなバイナリデータシーケンスの効率的なメモリ処理などが含まれます。高度なstream SDKでは、コンテンツタイプに基づく自動フィルタ選択、大規模ストリームの増分処理、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているPDF/UAなどの標準への準拠を保証するためのPDF仕様要件に対する検証などの最適化機能も提供される場合があります。

関連用語

  • Content stream(コンテンツストリーム) – ページコンテンツを記述するグラフィックスオペレーターとオペランドを含む特定のタイプのPDFストリーム
  • Filter(フィルタ) – FlateDecodeやDCTDecodeなど、ストリームデータに適用されるエンコードまたは圧縮アルゴリズム
  • Stream dictionary(ストリーム辞書) – ストリームデータの前に配置され、ストリームのプロパティに関するメタデータを含む辞書オブジェクト
  • PDF object(PDFオブジェクト) – ストリーム、辞書、配列、プリミティブ型を含む、PDFファイルの基本的なデータ構造
  • Decode parameters(デコードパラメータ) – フィルタ処理されたストリームデータを適切にデコードするために必要な追加情報を指定する辞書エントリ

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html