Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

OCProperties

概要

OCPropertiesは、PDF文書のCatalogディクショナリ内のエントリであり、文書内のオプショナルコンテンツ(レイヤー)の設定とプロパティを定義します ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このエントリは、オプショナルコンテンツグループがPDF全体でどのように整理、表示、管理されるかを制御します。OCPropertiesが存在する場合、文書にはユーザー設定、表示コンテキスト、またはアプリケーション設定に基づいて選択的に表示または非表示にできる、複数のバージョンまたはビューのコンテンツを含めることができます。

定義

OCPropertiesは、文書のCatalog内に配置されるディクショナリオブジェクトであり、PDFにおけるすべてのオプショナルコンテンツ機能の中心的な制御ポイントとして機能します。このディクショナリには3つの主要コンポーネントが含まれます:OCGs配列(文書内のすべてのオプショナルコンテンツグループをリスト化)、Dエントリ(デフォルトのオプショナルコンテンツ設定ディクショナリ)、およびオプションでConfigs配列(代替設定)です。他のフォーマットにおける単純なレイヤー実装とは異なり、OCPropertiesは、どのコンテンツグループが存在するかだけでなく、それらがユーザーにどのように提示されるべきか、初期の表示状態、階層的な関係、および使用状況に基づく表示ルールを定義する包括的なフレームワークを提供します。OCPropertiesエントリはPDF文書において完全にオプションです。その不在は、単に文書がオプショナルコンテンツ機能を含まないことを意味します。

重要性

PDF生成、操作、またはビューアアプリケーションを開発する開発者にとって、レイヤー機能を実装したり、条件付きコンテンツ表示を持つ文書を作成したりする際には、OCPropertiesの理解が不可欠です。これは、複数の詳細レベルを持つ技術文書、異なる言語版を切り替えられる多言語文書、またはユーザー入力に基づいてセクションを表示または非表示にするフォームを生成する必要があるアプリケーションを構築する際に特に重要になります。適切に設定されたOCPropertiesは、レイヤー化されたコンテンツが異なるPDFビューアやプラットフォーム間で一貫して動作することを保証し、混乱や情報の欠落につながる可能性のあるコンテンツ表示の問題を防ぎます。さらに、アクセシブルなPDFを扱う際には、開発者はオプショナルコンテンツが文書構造とアクセシビリティ機能を妨げないようにする必要があります。スクリーンリーダーや支援技術は、オプショナルコンテンツを適切に処理する必要があるためです。

全投稿を閲覧 gdoc_arrow_right_alt

Optical Character

概要

光学文字認識(OCR: Optical Character Recognition)は、スキャンした文書、写真、デジタル画像などのテキスト画像を、機械可読で検索可能なテキストデータに自動変換するプロセスです。PDFワークフローにおいて、OCRは紙文書をスキャンして機能的なデジタルPDFに変換する際に不可欠です。これにより、テキスト検索、選択、および ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの標準で求められるアクセシビリティ機能をサポートできます。この技術は、物理的な文書と完全にインタラクティブなデジタル形式の間の橋渡しを行い、文書管理システムがレガシーな紙の文書アーカイブを効果的に処理できるようにします。

定義

光学文字認識は、画像内の視覚的パターンを分析して英数字や記号を識別・抽出するコンピュータビジョン技術です。PDF作成に適用する場合、OCRは文書ページのビットマップ画像(通常はスキャンや撮影によって取得)を処理し、PDF構造内に埋め込むことができるテキストレイヤーを生成します。これは、アプリケーションによって直接作成され ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 形式で文字コードとして保存されるネイティブデジタルテキストとは異なります。単に画像を埋め込むだけの画像からPDFへの変換とは異なり、OCR対応PDFには元の画像と、重ね合わせられた、または非表示のテキストレイヤーの両方が含まれており、元の文書の視覚的外観を保持しながらコンテンツを検索可能でアクセシブルにします。

全投稿を閲覧 gdoc_arrow_right_alt

Optional Content

概要

Optional Contentは、ユーザーの設定や表示条件に基づいてコンテンツを選択的に表示または非表示にできるPDFの機能です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で正式に定義されているように、Optional Content Groups(OCG)により、文書作成者はコンテンツのレイヤーを整理し、閲覧者がそれらをオン・オフできるようにします。この機能は、多言語文書の作成、詳細レベルの切り替え、特定の表示コンテキストに応じたコンテンツの表示などに一般的に使用されます。

定義

Optional Contentは、PDFファイル内でコンテンツを個別のグループ(Optional Content Groups、OCG)に整理し、指定された条件やユーザー操作に応じて可視・不可視を制御できる構造的メカニズムです。各OCGには、テキスト、画像、注釈などの文書コンテンツのサブセットが含まれ、文書内の他のコンテンツとは独立して制御できます。デザインソフトウェアの単純なレイヤーシステムとは異なり、PDF Optional Contentは正式に標準化された機能であり、複雑な可視性ポリシー、意図された目的を定義するUsage Dictionary、グループ間のメンバーシップ関係をサポートします。PDF仕様では、Optional Content Groups(基本的な構成要素)と、Boolean論理を使用して複数のグループにコンテンツを関連付けることができるOptional Content Membership Dictionaries(OCMD)を区別しています。

全投稿を閲覧 gdoc_arrow_right_alt

Optional content group (OCG)

概要

Optional Content Group(OCG)は、PDF の基本機能の一つであり、コンテンツ要素をグループ化して、対応する PDF ビューアで動的に表示/非表示を切り替えられるようにします ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。ユーザーインターフェースでは「レイヤー」と呼ばれることが多く、OCG を使用することで、複数のファイルバージョンを用意することなく、単一の PDF ドキュメントでコンテンツの異なる表示を実現できます。この機能は、技術図面、多言語ドキュメント、選択的なコンテンツ表示が必要なインタラクティブプレゼンテーションなどで特に有用です。

定義

Optional Content Group は、PDF 構造内の dictionary オブジェクトであり、グラフィカルコンテンツ要素を共通の表示状態の下でグループ化します。常にレンダリングされる静的な PDF コンテンツとは異なり、OCG に関連付けられたコンテンツは、PDF 仕様で定義されているように、ユーザーの操作、表示コンテキスト、またはプログラムによる制御に基づいてオン/オフを切り替えることができます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

全投稿を閲覧 gdoc_arrow_right_alt

Optional content membership dictionary (OCMD)

概要

Optional Content Membership Dictionary(OCMD)は、複数のOptional Content Group(OCG)とそれらの状態を評価するための指定されたポリシーに基づいて、コンテンツの表示/非表示を決定するPDF構造です。単一のOCG参照とは異なり、OCMDは論理演算を使用して複数のOCGを組み合わせることで、複雑な表示ルールを可能にします。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、OCMDは複数のレイヤーやグループの表示状態に基づいて、どのコンテンツを表示するかをきめ細かく制御します。

定義

Optional Content Membership Dictionaryは、PDFファイル内の辞書オブジェクトであり、OCG参照の配列と、それらのOCG状態をどのように評価するかを決定する表示ポリシーを含みます。OCMDは単一のOCGを直接参照する代替手段として機能し、より高度な表示ロジックを実現します。単純なOCG参照は1つのレイヤーの状態に基づいてコンテンツを表示または非表示にしますが、OCMDは「OCG AとOCG Bの両方が表示されている場合にこのコンテンツを表示する」または「これらのOCGのいずれかが表示されている場合に表示する」といった条件を表現できます。

標準的なOCGとの主な違いは、OCMD自体はユーザーが直接切り替えられるレイヤーではなく、他のOCGの状態を監視し、ポリシーを適用して関連コンテンツの最終的な表示結果を決定する表示ルールプロセッサとして機能する点です。

重要性

レイヤー化されたPDF文書を扱う開発者にとって、OCMDは複雑な表示要件に応答する必要があるコンテンツを作成するために不可欠です。これは、技術文書、CAD図面、多言語文書など、コンテンツの表示が複数の条件に依存する場合に特に重要です。例えば、建築図面では、「電気設備」と「1階」の両方のレイヤーが同時にアクティブな場合にのみ特定の注釈を表示したい場合があります。

全投稿を閲覧 gdoc_arrow_right_alt

Page object

概要

Page objectは、PDF文書内の単一ページのプロパティとコンテンツを定義する辞書です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、各page objectにはページの寸法(MediaBox)、視覚的なコンテンツストリーム(Contents)、フォントや画像などの利用可能なリソース(Resources)といった重要な情報が含まれます。Page objectは、文書内のすべてのページを整理するPDFのページツリー構造の基本的な構成要素となります。

定義

Page objectは、PDF文書内の個別のページを表すPDF辞書型です。組織的なコンテナとして機能するページツリーノードとは異なり、page objectは常にページツリー階層のリーフノードであり、実際のページ属性とコンテンツを含みます。

Page object辞書には、Type(必ず/Pageである必要があります)やParent(ページツリーノードへの参照)などの必須エントリが含まれます。また、ページの特性を定義する重要なオプションエントリも含まれます:MediaBox(ページの境界を定義)、Contents(ページのマーキング操作を含む1つ以上のコンテンツストリーム)、Resources(コンテンツストリームが必要とするフォント、画像、グラフィック状態などのリソースの辞書)。追加のエントリは、ページの回転、crop box、注釈、メタデータ、Tagged PDFの構造要素などを指定できます。

各page objectは、明示的に定義されていない場合、ページツリーの親ノードから特定の属性を継承します。これにより、複数のページが共通のプロパティを共有する場合に効率的な保存が可能になります。

重要性

PDFの生成や操作を行う開発者にとって、page objectを理解することは以下の理由から不可欠です:

全投稿を閲覧 gdoc_arrow_right_alt

Page range (real page numbering)

概要

Page range(実ページ番号方式)は、PDF文書から特定のページ範囲を抽出または処理する際に、元の文書の実際のページ番号を維持する変換機能です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDF文書を扱う際、この機能により、ページラベルや論理的なページ番号が元の文書構造と一致した状態を保ち、ページ1から始まる連番に振り直されることがありません。

定義

Page range(実ページ番号方式)は、PDF文書からページの一部を抽出または変換する際に、元のPDFの実際のページ番号体系を保持する変換オプションです。ページを連番で振り直す単純なページ範囲抽出(例:10〜15ページを抽出して1〜6ページに振り直す)とは異なり、この機能は元のページ番号(10〜15のまま)を維持します。

この機能は、前付けにローマ数字(i、ii、iii)を使用し、本文にアラビア数字を使用するようなカスタムページ番号体系を持つPDF文書や、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されている文書カタログのPageLabelsエントリを通じて定義された複雑なラベリングシステムを持つ文書を扱う際に特に重要です。

全投稿を閲覧 gdoc_arrow_right_alt

Pages tree

概要

Pages treeは、PDFドキュメントの基本的な構造コンポーネントであり、ページオブジェクトの階層的なツリー構造を通じてすべてのページを整理します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、このツリーは中間の/Pagesノード(ページツリーノード)とリーフの/Pageノード(ページオブジェクト)で構成され、これらが集合的にドキュメントのページ構造を定義します。Pages treeにより、1ページから数千ページに及ぶドキュメントの効率的なナビゲーションと操作が可能になります。

定義

Pages treeは、すべてのPDFドキュメントに必要な階層的データ構造であり、親子関係を通じてページコンテンツを整理します。ルートには最上位ノードとして機能する/Pagesオブジェクトがあり、これは個々の/Pageオブジェクトまたはツリーをさらに細分化する中間の/Pagesノードを直接指すことができます。各/Pagesノードには、子ノード(追加の/Pagesノードまたは/Pageオブジェクト)をリストする/Kids配列と、そのノードから派生するページオブジェクトの総数を示す/Countエントリが含まれています ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。これは単純なフラットなページ配列とは異なり、ツリー構造により線形検索ではなく対数時間の検索が可能になるため、大規模なドキュメントでも効率的なアクセスと変更操作が可能になります。

全投稿を閲覧 gdoc_arrow_right_alt

PDF

概要

PDF(Portable Document Format)は、異なるプラットフォーム、アプリケーション、デバイス間でドキュメントを一貫して表示するために設計された、ISO標準化されたファイル形式です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、PDF 2.0はドキュメント管理と交換のための現行標準を表しています。2025年において、AIを活用したトレンドがPDFの作成、処理、アクセシビリティの実現方法を変革しており、特に自動タグ付け、インテリジェントなコンテンツ抽出、アクセシビリティ準拠の強化に重点が置かれています。

定義

PDFは、国際標準化機構(ISO)によって維持されているファイル形式仕様であり、テキスト、フォント、ベクターグラフィックス、ラスター画像、および表示に必要なその他の情報を含む、固定レイアウトドキュメントの完全な記述をカプセル化します。システム間でリフローや異なるレンダリングが発生する可能性のあるワードプロセッサ形式とは異なり、PDFは表示に使用されるソフトウェア、ハードウェア、オペレーティングシステムに関係なく、ドキュメントの正確な視覚的外観を保持します。

この形式は、オブジェクト、ストリーム、相互参照テーブルに基づく構造化された構文を使用してドキュメントコンテンツを整理します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) は、PDF 2.0の包括的な仕様を定義しており、強化された暗号化、改善された色管理、現代的なワークフローとのより良い統合などの最新機能のサポートを含んでいます。PDFは、HTMLやDOCXなどの形式とは異なり、編集可能性やレスポンシブレイアウトよりもプレゼンテーションの忠実性を優先します。

全投稿を閲覧 gdoc_arrow_right_alt

PDF annotations API reference

概要

PDF annotations APIリファレンスは、PDFドキュメント内のインタラクティブ要素を作成、変更、管理するためのプログラマティックインターフェースを提供します。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、annotationsは基礎となるコンテンツを変更することなくPDFページに追加できるオブジェクトです。これらのAPIにより、開発者はコメント、ハイライト、フォームフィールド、マルチメディア要素などの機能を実装できます。annotation APIの理解は、インタラクティブなPDFアプリケーションやドキュメント共同作業ツールを構築する上で不可欠です。

定義

PDF annotations APIリファレンスは、PDFのannotationオブジェクトをプログラマティックに操作するために利用可能なメソッド、クラス、関数を記述した包括的なドキュメントです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、annotationsはページコンテンツとは区別され、独自のappearance streamとプロパティを保持します。APIリファレンスは通常、テキストannotations(メモやコメント)、マークアップannotations(ハイライト、下線、取り消し線)、インタラクティブannotations(リンクやボタン)、widget annotations(フォームフィールド)、マルチメディアannotations(音声、動画、3Dオブジェクト)など、様々なannotationタイプをカバーしています。ページのcontent streamを変更する直接的なコンテンツ操作APIとは異なり、annotation APIは、基礎となるドキュメント構造に影響を与えることなく表示切替、変更、削除が可能なインタラクティブ要素の独立したレイヤーを扱います。この分離により、annotationsはレビューワークフロー、 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) で参照されているアクセシビリティの強化、共同編集シナリオに特に適しています。

全投稿を閲覧 gdoc_arrow_right_alt