Image indexing
Image indexingとは、PDF文書の構造内で画像XObjectを体系的に整理し参照する仕組みを指します。
Image indexingとは、PDF文書の構造内で画像XObjectを体系的に整理し参照する仕組みを指します。PDFワークフローでは、画像は外部オブジェクト(XObject)として保存され、コンテンツストリームから一意の識別子を通じて参照されます。これにより、同じ画像を重複させることなく複数回再利用できます ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このインデックス機構は効率的なPDFファイル構築の基盤であり、開発者がプログラムで画像リソースを管理することを可能にします。
Image indexingとは、PDF文書がドキュメントのリソース辞書内で画像XObjectに一意の識別子を割り当て、維持するプロセスです。各画像はリソース辞書に名前(/Im1、/Image5、/Img23など)で登録され、この名前がインデックスとして機能します。コンテンツストリームが画像を表示する必要がある場合、画像データを直接埋め込むのではなく、このインデックスを参照します。これは画像データの保存方法に焦点を当てた画像埋め込み(image embedding)や、画像データのエンコード方法を扱う画像圧縮(image compression)とは異なります。Image indexingは特に、コンテンツストリームが画像リソースを効率的に見つけて参照できるようにする組織化レイヤーに関わるものです。
PDFの生成や操作を行う開発者にとって、image indexingを理解することは、いくつかの実践的な理由から重要です。第一に、メモリ使用の効率化が可能になります。インデックス化された1つの画像を文書全体で何百回も参照しても、ファイルサイズが比例して増加することはありません。第二に、プログラムによるPDF作成が簡素化されます。開発者は画像を一度登録し、そのインデックスを使って繰り返し参照できます。第三に、適切なimage indexingは文書構造の整合性を維持するために不可欠であり、特にTagged PDFではアクセシビリティ機能が正しいリソース構成に依存しています ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 。最後に、表示の問題のトラブルシューティングやPDFファイルサイズの最適化を行う際には、文書構造内で画像がどのようにインデックス化され参照されているかを検証する必要があります。
Image indexingは、PDFのリソース辞書階層を通じて動作します。画像がPDFに追加されると、その画像は寸法、色空間、エンコードされたデータを定義するプロパティを持つXObjectストリームになります。次に、このXObjectはリソース辞書(通常はページレベルまたは共有リソース)に一意の名前で登録されます。構文は/Name ObjectReferenceのパターンに従い、例えば/Im1 5 0 Rでは、Im1がインデックス名、5 0 Rが実際の画像オブジェクトへの参照を示します。
コンテンツストリームは、Doオペレータと画像のインデックス名を組み合わせて、インデックス化された画像を呼び出します。例えば、/Im1 Doというコマンドは、PDFレンダラーにIm1として登録された画像を表示するよう指示します。レンダラーはこのインデックスを使用してリソース辞書内の対応するXObjectを見つけ、画像データを取得し、現在のグラフィックス状態に従ってレンダリングします。
複数ページを持つ文書では、画像インデックスはリソース階層の異なるレベルで定義できます。ページ固有のリソース辞書にはそのページでのみ使用される画像が含まれ、親のリソース辞書には複数のページで共有される画像を保持できます。PDFレンダラーはこの階層を上方向に検索して画像参照を解決し、ローカルとグローバルの両方の画像インデックス戦略を可能にします ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。
- XObject – 画像、フォーム、その他のコンテンツを含むことができる、PDF内の再利用可能な外部オブジェクト
- Resource dictionary(リソース辞書) – フォント、画像、グラフィックス状態などのPDFオブジェクトに名前をマッピングするデータ構造
- Content stream(コンテンツストリーム) – PDFページに表示される内容を定義する命令のシーケンス
- Image compression(画像圧縮) – PDF内の画像データの保存サイズを削減するために使用される技術
- Tagged PDF – アクセシビリティとコンテンツ再利用のためのセマンティック情報を含む構造化されたPDF形式
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
