Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

Dictionary object

概要

Dictionary objectは、PDFにおける基本的なデータ構造で、キーと値を対応付け、二重山括弧<< ... >>で囲まれます。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によると、dictionaryはPDFファイル構造の骨格を形成する基本的なオブジェクトタイプの1つです。PDFドキュメント全体でメタデータ、パラメータ、構造情報を整理するための主要なメカニズムとして機能します。

定義

Dictionary objectは、キーと値のペアを含む連想テーブルです。キーは常にname object(スラッシュで始まる)であり、値は任意のPDFオブジェクトタイプを取ることができます。構文は二重山括弧を区切り文字として使用します:<< /Key1 value1 /Key2 value2 >>。例えば、シンプルなdictionaryは<< /Type /Page /MediaBox [0 0 612 792] >>のようになります。

全投稿を閲覧 gdoc_arrow_right_alt

Discover pdfa.org

概要

PDF Association(pdfa.org)は、PDF標準とベストプラクティスの開発および普及を担当する国際組織です。PDF仕様に関してISOと緊密に協力する業界団体として、PDF Associationは、PDF技術を実装する開発者向けに不可欠なリソース、技術文書、ガイダンスを提供しています ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。この組織は、PDF/A、PDF/UA、Tagged PDFなど、さまざまなPDF標準のワーキンググループを運営しています。

定義

PDF Associationは、世界中のPDF技術における中心的な権威および提唱団体として機能する会員制組織です。PDF関連のISO標準の開発を調整し、Tagged PDF Best Practice Guide ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) などの補足文書を公開することで、開発者が複雑な仕様を理解し実装することを支援しています。正式な標準を公開するISO自体とは異なり、PDF Associationは、PDF/UA-1 ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などのPDF仕様に取り組む開発者向けに、実用的な実装ガイダンス、教育リソース、コミュニティサポートを提供します。この組織は、ホワイトペーパー、技術ノート、標準実装を明確化するベストプラクティスガイドを提供することで、正式なISO標準文書と現実の開発者ニーズとのギャップを埋めています。

全投稿を閲覧 gdoc_arrow_right_alt

Embedded file

概要

Embedded fileとは、PDFドキュメント内に独立したデータストリームとして保存される、完全な非PDFファイルです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、embedded filesによってPDFドキュメントは複数のファイルタイプのコンテナとして機能し、ユーザーはソースデータ、補足ドキュメント、マルチメディアファイルなどの関連アセットを、主要なPDFコンテンツと共にパッケージ化できます。この機能により、PDFは単純なドキュメント形式から、関連ファイル間の関係性を維持するポータブルアーカイブへと変化します。

定義

Embedded fileとは、PDFの内部構造に保存されるバイナリファイルストリームであり、PDFの可視ページコンテンツとは区別されます。電子メールシステムの添付ファイルとは異なり、embedded filesはPDFファイル自体の不可欠な部分となり、全体のファイルサイズは増加しますが、関連ファイルが単一のユニットとして一緒に移動することを保証します。PDF仕様では、embedded file streamsは、元のファイル名、MIMEタイプ、作成日、変更日などのメタデータと共に実際のファイルデータを含む辞書オブジェクトとして定義されています。

Embedded filesは、同じくPDF内に保存されるインライン画像やフォントとは異なります。これらはドキュメントの視覚的表示の一部として直接レンダリングされますが、embedded filesは、ユーザーがPDFビューアの添付ファイルパネルやアノテーションを通じて明示的にアクセスするまで休止状態のままです。Embedded filesは元のファイル形式を維持し、PDFコンテナから独立して抽出および使用できます。

重要性

PDF生成および処理を行う開発者にとって、embedded filesはいくつかの実用的な利点を提供します。外部ファイル参照やネットワーク上の場所に依存しない自己完結型のドキュメントパッケージの作成を可能にし、これはアーカイブコンプライアンスや長期的なドキュメント保存において重要です。これは特に、すべての補足ドキュメントを含む完全な記録の維持が求められる規制環境において重要です。

全投稿を閲覧 gdoc_arrow_right_alt

EMF

概要

Enhanced Metafile(EMF)は、Microsoftが古いWindows Metafile(WMF)形式の後継として開発した32ビットグラフィック形式です。デバイス非依存のコンテナとして機能し、ベクターグラフィックスとラスターグラフィックスの両方のデータを格納できるため、Windowsアプリケーションにおけるグラフィックス表現の一般的な形式となっています。ドキュメントをPDFに変換する際、特にMicrosoft Officeアプリケーションからドキュメントを処理する場合、EMFファイルは中間表現として頻繁に使用されます ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html )

定義

EMFは、主にWindowsの印刷システムとグラフィックスレンダリングで使用されるスプールファイル形式です。BMPやJPEGのような純粋なラスター形式とは異なり、EMFファイルには画像を再構築する方法を記述するGraphics Device Interface(GDI)コマンドのレコードが含まれています。このコマンドベースの構造により、EMFファイルはベクターコンポーネントのスケーラビリティを維持しながら、埋め込みビットマップデータもサポートできます。

EMFは、32ビット操作のより良いサポート、色深度の向上、より洗練されたグラフィックスプリミティブなど、強化された機能を提供することで、前身のWMFとは異なります。また、EMFはWindowsプラットフォームに特化しているのに対し、Portable Document Format(PDF)はプラットフォーム非依存のドキュメント形式として設計されているという点でPDFとも異なります。EMFコンテンツをPDFドキュメントにインポートする際、GDIコマンドはPDF独自のグラフィックス演算子とコンテンツストリームに変換される必要があります。

重要性

PDF生成やドキュメント変換に携わる開発者にとって、EMFの理解は非常に重要です。なぜなら、WindowsベースのドキュメントワークフローにおいてEMFは中間形式として頻繁に登場するからです。ユーザーがドキュメントをPDFに印刷したり、Officeドキュメントを変換したりする際、Windowsの印刷サブシステムはEMFファイルを生成することが多く、これらは適切に解釈されてPDFコンテンツに変換される必要があります。

全投稿を閲覧 gdoc_arrow_right_alt

EOF marker

概要

EOF markerは、%%EOFという文字列を含む特殊な行で、PDFファイルの物理的な終端を示します ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) 。このマーカーはすべての有効なPDFファイルで必須であり、PDFリーダーに対して文書構造の終端に到達したことを明確に通知する役割を果たします。このマーカーがない場合、PDFプロセッサはファイルの終端を確実に判断できず、解析エラーや不完全な文書レンダリングを引き起こす可能性があります。

定義

EOF markerは、2つのパーセント記号に続いて「EOF」という文字列で構成されるリテラル文字列(%%EOF)で、通常はPDFファイルの最終行に配置されます。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によれば、PDFファイルが構造的に有効とみなされるためには、このマーカーが存在する必要があります。このマーカーは、最終的なクロスリファレンステーブルやtrailer dictionaryを含む、すべてのPDFコンテンツの後に配置されます。単純に見えますが、EOF markerは他のPDFコメント(同様に%で始まる)とは異なり、メタデータや人間が読める情報を提供するのではなく、構造的な目的を果たします。マーカーの後には、オプションの空白文字や改行文字のみが許可され、それ以降にPDFコンテンツを配置することはできません。

全投稿を閲覧 gdoc_arrow_right_alt

Even-odd fill rule

概要

Even-odd fill rule(偶奇塗りつぶし規則)は、PDF でグラフィックスをレンダリングする際に、パスのどの領域を塗りつぶすかを決定するために使用される幾何学的アルゴリズムです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、この規則は、ある点からどの方向にも光線を引き、その光線がパスセグメントと交差する回数を数えることで、その点がパスの内側にあるか外側にあるかを判定します。交差回数が奇数の場合、その点は内側にあり、偶数の場合は外側にあります。

定義

Even-odd fill rule は、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で PDF レンダリング用に規定されている2つの標準パス塗りつぶしアルゴリズムの1つです(もう1つは nonzero winding number rule)。この規則は、特に自己交差や複数のサブパスを持つ複雑なパスの「内側性」を判定するための、直感的な数学的手法を提供します。

全投稿を閲覧 gdoc_arrow_right_alt

FlateDecode

概要

FlateDecodeは、PDFファイルで最も広く使用されている圧縮フィルタであり、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているzlib/deflate圧縮アルゴリズムを実装しています。コンテンツストリーム、メタデータ、画像データなど、さまざまなPDFオブジェクトを圧縮することでファイルサイズを削減します。可逆圧縮方式として、FlateDecodeはデータの整合性を保ちながら、ストレージと転送の要件を大幅に削減します。

定義

FlateDecodeは、PDFファイル内のデータをエンコードするために、zlibラッパー形式(RFC 1950)を用いたDEFLATEアルゴリズム(RFC 1951)を適用する圧縮フィルタです。情報を破棄して圧縮を実現するDCTDecode(JPEG)などの非可逆圧縮フィルタとは異なり、FlateDecodeは解凍後のデータが元の入力と完全に一致することを保証します。このフィルタはPDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されており、ページコンテンツストリーム、フォントデータ、各種メタデータ構造など、PDFドキュメント全体のストリームに適用できます。FlateDecodeは、Lempel-Ziv-Welchアルゴリズムを使用するLZWDecodeなどの他の可逆フィルタとは、圧縮効率、広範なサポート、特許制限がない点で異なります。

全投稿を閲覧 gdoc_arrow_right_alt

Flattening

概要

Flatteningとは、フォームフィールド、注釈、レイヤーなどのインタラクティブまたは動的なPDF要素を、PDFの視覚的な外観の恒久的な部分となる静的なページコンテンツに変換するプロセスです。Flatteningが実行されると、これらの要素は個別のオブジェクトとして編集または操作できなくなります。このプロセスは、文書の最終化、異なるPDFビューア間での一貫したレンダリングの保証、 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているアーカイブまたは印刷ワークフロー用の文書準備に一般的に使用されます。

定義

Flatteningは、インタラクティブなPDFコンポーネントをページ上の固定されたグラフィカルコンテンツに変換します。PDFにフォームフィールド(テキストボックス、チェックボックス、ドロップダウンメニューなど)や注釈(コメント、ハイライト、スタンプなど)が含まれている場合、これらの要素はPDF構造内で独自のプロパティと動作を持つ個別のオブジェクトとして存在します。Flatteningは、これらのオブジェクトをページのコンテンツストリームに直接統合し、通常のグラフィックス、テキスト、または画像としてレンダリングします。

これは、入力済みフォームや表示された注釈を含むPDFを単に表示することとは異なります。それらの要素は編集可能でインタラクティブなままです。Flatteningは、インタラクションを可能にする基礎データ構造を削除する不可逆的な操作であり、視覚的な外観をページ自体に実質的に「焼き付ける」ものです。また、ページ全体をビットマップ画像に変換するラスタライゼーションとも異なります。Flatteningは通常、ベクターコンテンツとテキストを可能な限り保持し、インタラクティブ要素のみを静的な視覚的等価物に変換します。

重要性

PDFの生成と処理に携わる開発者にとって、Flatteningはいくつかの実用的な理由から重要です。

全投稿を閲覧 gdoc_arrow_right_alt

Form data submission

概要

フォームデータ送信とは、インタラクティブなPDFフォームフィールドに入力されたデータをサーバーやアプリケーションに転送して処理するプロセスです。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、PDFフォームはHTML形式の送信、XML Forms Data Format(XFDF)、PDF形式自体など、さまざまな送信形式をサポートしています。この機能により、PDFドキュメントはWebサービスやエンタープライズシステムと統合できるインタラクティブなデータ収集ツールとして機能します。

定義

PDFにおけるフォームデータ送信とは、PDFドキュメントからユーザーが入力したフォームフィールドの値を、指定された宛先(通常はWebサーバーまたはアプリケーションのエンドポイント)に自動的に転送することを指します。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、フォーム設計者がユーザーがフォームを完成させた際にフォームデータをどのように、どこに送信するかを設定できるsubmit-formアクションが定義されています。

全投稿を閲覧 gdoc_arrow_right_alt

Forms

概要

PDF文書におけるFormsは、ユーザーがPDFファイル内で直接データを入力、選択、送信できるインタラクティブな要素です。 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、PDF formsはテキストボックス、チェックボックス、ラジオボタン、ドロップダウンリストなどの入力可能なフィールドを作成するための標準化された方法を提供します。Formsにより、PDFは従来の紙の書式をデジタルで電子的に記入可能な形式に置き換え、データ収集のための動的な文書として機能できるようになります。

定義

PDF formsは、PDF文書内に埋め込まれた構造化データ入力メカニズムであり、フォームフィールドと関連メタデータで構成されます。各フォームフィールドには特定のタイプ(テキストフィールド、ボタン、選択フィールド、署名フィールド)があり、外観、動作、検証ルールを定義するプロパティを持ちます。PDF formsは2つの主要な技術を使用して実装できます:PDF構造自体にフォームフィールド定義を格納するAcroFormsと、フォームコンテンツとロジックを記述するXMLベースの形式であるXFA(XML Forms Architecture)です。AcroFormsはより広くサポートされており、異なるPDFビューアや処理ツール間で互換性を維持するインタラクティブなPDF formsを作成するための標準的なアプローチです。

静的なPDFコンテンツとは異なり、formsは双方向のインタラクションモデルを作成し、ユーザーは基礎となるページコンテンツを変更することなく、文書の特定の部分を変更できます。フォームデータは視覚的な表示とは別のレイヤーとして存在するため、PDFファイル自体とは独立してデータを抽出、インポート、または送信できます。

重要性

PDFを扱う開発者にとって、formsを理解することは以下のような実用的な理由から不可欠です:

全投稿を閲覧 gdoc_arrow_right_alt