Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Image SDK

概要

Image SDK(Software Development Kit)は、開発者がPDF文書内の画像をプログラム的に操作、抽出、埋め込みできるようにするツール、ライブラリ、APIの集合体です。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) は画像がPDFファイル内でどのように構造化され保存されるかを定義していますが、Image SDKは開発者がこれらの画像オブジェクトを操作するために使用する実用的な実装レイヤーを提供します。これらのSDKはPDF画像操作の複雑さを抽象化し、開発者が低レベルのPDF構文ではなくアプリケーションロジックに集中できるようにします。

定義

Image SDKは、PDFワークフローにおける画像関連の操作を処理するために設計された専用のソフトウェアツールキットです。PDFページからラスター画像を抽出する、画像をPDF互換フォーマットに変換する、変換を適用する、画像圧縮を管理する、PDFコンテンツストリームに画像を埋め込むといった一般的なタスク用の事前構築された関数とメソッドを提供します。汎用的な画像処理ライブラリとは異なり、Image SDKはPDFの画像モデルに特化して最適化されており、PDF固有の画像ディクショナリ、カラースペース、圧縮フィルタ(JPEGのDCTDecodeやPNGのFlateDecodeなど)、および ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているインライン画像オブジェクトと外部画像オブジェクトを理解します。SDKは、生のPDF構造と開発者に優しいプログラミングインターフェースの間のギャップを埋め、通常はJava、Python、C++、JavaScriptなどの言語で利用可能です。

全投稿を閲覧 gdoc_arrow_right_alt

Image search

概要

PDFにおけるImage searchとは、画像のプロパティ、メタデータ、またはドキュメント構造内の位置など、さまざまな基準に基づいて、PDF文書に埋め込まれた画像を検索および取得する機能を指します。検索可能なテキストコンテンツに依存するテキスト検索とは異なり、Image searchでは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDFのリソースディクショナリとコンテンツストリームへのアクセスが必要です。この機能は、ビジュアルコンテンツをプログラムで抽出、分析、または操作する必要があるアプリケーションにとって不可欠です。

定義

Image searchとは、PDFのページコンテンツストリームとリソース内のimage XObjectを識別してアクセスするためのプログラム技術です。PDFアーキテクチャでは、画像はサブタイプ/Imageを持つXObjectリソースとして保存され、ドキュメント全体で複数回参照できます。Image searchは、テキストコンテンツではなくバイナリ画像データと画像ディクショナリを操作する点でテキスト検索とは異なり、開発者はPDFコンテンツストリームを解析し、画像フィルタをデコードし、寸法、色空間、圧縮方法などの画像関連属性を解釈する必要があります。アクセシブルなPDFを扱う場合、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているように、Image searchには構造要素と代替テキスト説明の検査も含まれる場合があります。

全投稿を閲覧 gdoc_arrow_right_alt

Image thumbnails

概要

PDF文書におけるImage thumbnailsとは、PDFファイル構造内に埋め込むことができる、ページコンテンツの小さな事前レンダリング版のプレビューです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、thumbnailsはページの縮小版の視覚的表現を提供し、主にナビゲーションインターフェースや文書プレビュー機能で使用されます。現代のPDFワークフローではオプション機能ですが、適切に実装された場合、thumbnailsはユーザー体験の最適化に貢献します。

定義

Image thumbnailsとは、PDF文書構造内にImage XObjectとして保存される、圧縮された低解像度のPDFページ表現です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、PDFの各ページは、Page dictionaryにthumbnail画像を参照するオプションのThumbエントリを持つことができます。これらのthumbnailsは実際のページコンテンツストリームとは別物であり、独立したビットマップ画像として存在し、通常はフルページよりもはるかに小さいサイズでレンダリングされます。

全投稿を閲覧 gdoc_arrow_right_alt

Indexed color space

概要

Indexed color spaceは、PDF文書においてパレットベースの色表現方法であり、ルックアップテーブルを使用してカラーインデックスをベース色空間内の実際の色値にマッピングします ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。各ピクセルの完全な色指定を保存する代わりに、indexed color spaceはパレット内の事前定義された色を参照するインデックス値のみを保存するため、限られた色パレットを持つ画像のファイルサイズを大幅に削減できます。このアプローチは、ロゴ、図表、および256色以下の画像などのグラフィックスに特に効果的です。

定義

Indexed color spaceは2つのコンポーネントで構成されます。ベース色空間で定義された実際の色値の限定されたセットを含むカラーテーブル(またはパレット)と、そのテーブル内の特定のエントリを参照するインデックス値です。カラーテーブルは、整数インデックス(通常0-255)をDeviceRGB、DeviceCMYK、DeviceGrayなどの基底となるベース色空間の色指定にマッピングします ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。各ピクセルが完全な色情報を保存する直接色空間とは異なり、indexed color spaceはインデックス番号のみを保存するため、間接的な色指定の一形態となります。

全投稿を閲覧 gdoc_arrow_right_alt

Indirect object

概要

Indirect objectは、PDF ファイル構造の基本的な構成要素であり、コンテンツを一度保存して文書全体で複数回参照できるようにします。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、各indirect objectには一意のオブジェクト番号と世代番号が割り当てられ、データを複製することなくPDFの他の部分から参照できます。このメカニズムは、ファイルサイズを最小化し、文書コンテンツへのランダムアクセスを可能にする、効率的で適切に構造化されたPDFファイルを作成するために不可欠です。

定義

Indirect objectとは、オブジェクト番号と世代番号でラベル付けされた任意のPDFオブジェクト(辞書、ストリーム、配列、または単純な値など)であり、PDFファイル本体内で独立してアドレス指定可能になります。オブジェクトはn g obj ... endobjという構文を使用して定義されます。ここで、nはオブジェクト番号、gは世代番号(更新されたことのないオブジェクトの場合は通常0)であり、コンテンツはobjendobjキーワードの間に記述されます。

Indirect objectとdirect objectには重要な違いがあります。Direct objectは使用される場所にインラインで埋め込まれますが、indirect objectはPDF本体に別途保存され、n g Rという構文を使用してオブジェクト番号と世代番号で参照されます。この間接参照により、同じオブジェクトをコンテンツを複製することなく複数の場所から参照できます。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、これは文書全体で繰り返し使用される可能性のあるフォント、画像、ページオブジェクトなどのリソースにとって特に重要です。

全投稿を閲覧 gdoc_arrow_right_alt

Intellectual Property

概要

PDFにおけるIntellectual Property Rights(IPR、知的財産権)ポリシーとは、PDF標準および仕様内での知的財産の所有権、使用、保護を規定する法的枠組みとガイドラインを指します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) などの標準で維持されているPDF仕様自体も、開発者がPDF関連ソフトウェアを実装および配布する方法に影響を与える知的財産の考慮事項の対象となります。これらのポリシーを理解することは、PDF標準を扱う開発者が法的コンプライアンスと適切なライセンスを確保するために不可欠です。

定義

Intellectual Property Rights Policyは、PDF標準、仕様、および関連技術に関連する法的権利と制限を包含します。これには、標準化団体、貢献企業、または個々の発明者が保有する可能性のある特許、著作権、商標、およびその他の所有権が含まれます。PDFエコシステムにおいて、IPRポリシーは、実装者が標準化された技術をどのように使用できるか、どのようなライセンス義務を負う可能性があるか、PDF準拠ソフトウェアを作成する際にどのような権利を保持するかを定義します。このポリシーフレームワークは、PDFコンテンツ自体の著作権保護とは異なり、PDF仕様の実装と使用、およびアクセシビリティ機能のための ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの関連標準に関連する権利を具体的に扱います。

全投稿を閲覧 gdoc_arrow_right_alt

JavaScript action

概要

JavaScript actionは、PDF内に埋め込まれたJavaScriptコードを実行するPDFのアクションタイプです。ユーザーインタラクションやドキュメントイベントによってトリガーされると、JavaScript actionはPDFファイルに動的な動作とインタラクティブ性をもたらします。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、JavaScript actionはPDF仕様で利用可能な複数のアクションタイプの1つであり、PDFドキュメント内でスクリプト機能を実現します。

定義

JavaScript actionは、JavaScriptサポートを持つ準拠PDFプロセッサによって実行されるJavaScriptコードを含む、特定のタイプのPDFアクションオブジェクトです。ナビゲーションやフォーム送信など事前定義された操作を実行する他のアクションタイプとは異なり、JavaScript actionは埋め込まれたスクリプトを通じて柔軟でプログラム可能な動作を提供します。このアクションは、アクションタイプ「JavaScript」として定義され、実行するJavaScriptコードを含むテキスト文字列またはストリームを含んでいます。

JavaScript actionは、ボタンクリック、ページ開封イベント、フォームフィールド変更などの特定のトリガーに関連付けることができるアクションオブジェクトとして明示的に定義されている点で、他のPDFスクリプト機構とは異なります。JavaScriptコードは、PDFプロセッサのJavaScriptエンジン内で実行されます。このエンジンは、コアECMAScriptをベースとし、ドキュメント操作のためのPDF固有の拡張機能を持つJavaScriptのサブセットを実装しています。

重要性

JavaScript actionは、インタラクティブなPDFフォーム、動的ドキュメント、カスタム検証ロジックを作成する開発者にとって重要です。以下を可能にします:

全投稿を閲覧 gdoc_arrow_right_alt

JBIG2

概要

JBIG2は、2値(白黒)画像専用に設計された非可逆または可逆の圧縮方式で、スキャン文書、テキストページ、線画に対して非常に効果的です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、JBIG2はPDFで画像データをエンコードする際にサポートされる圧縮フィルタの1つです。特に複数のページに類似したシンボルやパターンが含まれる場合、CCITT Group 4などの古い方式よりも大幅に高い圧縮率を実現できます。

定義

JBIG2(Joint Bi-level Image Experts Group 2)は、2値画像—通常は白黒の2色のみを含む画像—専用に設計された圧縮標準です。連続階調カラー画像向けに設計されたJPEGやPNGなどの汎用画像圧縮フォーマットとは異なり、JBIG2はテキストや線画の特性を活用します。このアルゴリズムは、デコードされた画像が元の画像と同一である可逆モード、または視覚的に類似したパターンをまとめて圧縮することでより高い圧縮率を実現する非可逆モードのいずれかで動作します。PDF文書 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、JBIG2はファイルサイズの削減が重要でありながら可読性を維持する必要があるスキャン文書に特に有用です。この標準は、パターンマッチングと置換機能を追加することで前身のJBIG1と異なり、繰り返される形状(ページ上に複数回出現する文字「e」など)を認識してより効率的に保存できます。

全投稿を閲覧 gdoc_arrow_right_alt

JBIG2Decode

概要

JBIG2Decodeは、PDFドキュメントにおいて2値(白黒)画像、特にスキャンされたテキストページやドキュメントを効率的にエンコードするために使用される圧縮フィルターです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、このフィルターはJBIG2圧縮標準を適用し、画像品質を維持しながら従来の方法よりも大幅に高い圧縮率を実現します。JBIG2Decodeは、スキャンされたドキュメントを含むPDFファイルにおいて特に価値があり、他の圧縮方法と比較してファイルサイズを3倍から10倍削減できます。

定義

JBIG2Decodeは、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているストリームフィルターで、PDFファイル内の2値画像に対してJBIG2(Joint Bi-level Image Experts Group 2)圧縮標準を実装します。FlateDecodeなどの汎用圧縮フィルターとは異なり、JBIG2Decodeは2色のみを含む画像(通常は白と黒)に特化して最適化されており、スキャンされたドキュメント、テキストページ、線画、その他の2値コンテンツに最適です。

全投稿を閲覧 gdoc_arrow_right_alt

JPEG

概要

JPEG(Joint Photographic Experts Group)は、写真画像に広く使用される非可逆圧縮フォーマットであり、PDFドキュメントに直接埋め込むことができます。PDFでは、JPEG圧縮された画像データは通常DCTDecodeフィルタを通じて処理されます。これにより、PDFは標準的なJPEGフォーマットとの互換性を維持しながら、写真コンテンツを効率的に保存できます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。そのため、JPEGは、特に写真や複雑なカラー画像を含むドキュメントにおいて、PDFファイル内で最も一般的な画像フォーマットの一つとなっています。

定義

JPEGは、離散コサイン変換(DCT)アルゴリズムを使用してファイルサイズを削減する標準化された画像圧縮方式です。人間の目に知覚されにくい画像データを選択的に破棄することで圧縮を実現します。PDFドキュメント内では、JPEG画像はストリーム辞書にDCTDecodeフィルタが指定されたImage XObjectとして表現されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。PNGやLZW圧縮を使用したTIFFなどの可逆フォーマットとは異なり、JPEG圧縮はファイルサイズを小さくするために一部の画像データを永久的に削除するため、「非可逆」と呼ばれます。PDF仕様では、JPEGデータを再エンコードせずに直接保存できるため、JPEGファイルは元の圧縮形式を保持したままPDFに埋め込むことができます。これは、BMPや非圧縮TIFFなどのフォーマットとは異なります。これらのフォーマットは埋め込み時にPDF圧縮フィルタを使用してエンコードする必要があります。

全投稿を閲覧 gdoc_arrow_right_alt