Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Image search

PDFにおけるImage searchとは、画像のプロパティ、メタデータ、またはドキュメント構造内の位置など、さまざまな基準に基づいて、PDF文書に埋め込まれた画像を検索および取得する機能を指します。

カテゴリ: General PDF Concepts
キーワード: image search, Image search

概要

PDFにおけるImage searchとは、画像のプロパティ、メタデータ、またはドキュメント構造内の位置など、さまざまな基準に基づいて、PDF文書に埋め込まれた画像を検索および取得する機能を指します。検索可能なテキストコンテンツに依存するテキスト検索とは異なり、Image searchでは ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDFのリソースディクショナリとコンテンツストリームへのアクセスが必要です。この機能は、ビジュアルコンテンツをプログラムで抽出、分析、または操作する必要があるアプリケーションにとって不可欠です。

定義

Image searchとは、PDFのページコンテンツストリームとリソース内のimage XObjectを識別してアクセスするためのプログラム技術です。PDFアーキテクチャでは、画像はサブタイプ/Imageを持つXObjectリソースとして保存され、ドキュメント全体で複数回参照できます。Image searchは、テキストコンテンツではなくバイナリ画像データと画像ディクショナリを操作する点でテキスト検索とは異なり、開発者はPDFコンテンツストリームを解析し、画像フィルタをデコードし、寸法、色空間、圧縮方法などの画像関連属性を解釈する必要があります。アクセシブルなPDFを扱う場合、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で概説されているように、Image searchには構造要素と代替テキスト説明の検査も含まれる場合があります。

重要性

PDF処理アプリケーションを構築する開発者にとって、Image search機能はいくつかの実用的なシナリオで重要です:アーカイブや再利用のための画像抽出、ドキュメント構成の分析、重複画像を識別してファイルサイズを最適化、適切な代替テキストのない画像を検出してアクセシビリティコンプライアンスを確保、ビジュアルアセットをカタログ化するコンテンツ管理システムの実装などです。Image searchの実行方法を理解することで、開発者はより高度なドキュメント処理ワークフローを作成できます。特に、手動での画像識別が非実用的な大規模なドキュメントコレクションを処理する場合に有用です。さらに、 ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で説明されているTagged PDFワークフローでは、Image searchはすべての意味のある画像が適切にタグ付けされ、適切な構造要素に関連付けられていることを検証するのに役立ちます。

仕組み

Image searchは、PDFのページ構造をトラバースし、コンテンツストリームでimage XObject参照を検査することで動作します。このプロセスには通常以下が含まれます:(1) 各ページのResourcesディクショナリにアクセスして、サブタイプ/ImageのXObjectを識別する、(2) ページのコンテンツストリームを解析して、画像呼び出し演算子(通常は「Do」演算子とそれに続く画像名)を見つける、(3) 幅、高さ、色空間、コンポーネントあたりのビット数、および適用されたフィルタを含む画像プロパティを画像ディクショナリから取得する、(4) コンテンツベースの検索のためにピクセル情報にアクセスするために、オプションで画像データをデコードする、(5) 画像呼び出し時の変換マトリックスを記録して、ページ上のサイズと位置を決定する。高度なImage search実装では、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているドキュメントの構造ツリーを検査して、画像を論理ドキュメント構造と関連付け、代替テキストを識別し、ドキュメント階層内の画像のセマンティックな役割を決定することもあります。

関連用語

  • XObject – 画像、フォーム、PostScriptフラグメントを含む、PDFにおける再利用可能な外部オブジェクト
  • Content Stream – ページまたはフォームの外観を記述する演算子とオペランドのシーケンス
  • Image XObject – 関連する属性を持つ画像データを含む特定のタイプのXObject
  • Structure Tree – Tagged PDFにおける論理ドキュメント構造の階層表現
  • Resources Dictionary – コンテンツストリームで使用されるすべての外部リソースを含むディクショナリ

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html