Skip to main content
Interwork Corporation
IDR Solutions Product Support Portal
PDF開発用語集 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動 モードの切替 ダーク/ライト/自動

PDF metadata on-premise

PDF metadata on-premiseとは、クラウドベースのサービスではなく、ローカルにホストされたインフラストラクチャ内でPDFファイルからドキュメントメタデータを抽出、管理、変更することを指します。

キーワード: pdf metadata on-premise, PDF metadata on-premise

概要

PDF metadata on-premiseとは、クラウドベースのサービスではなく、ローカルにホストされたインフラストラクチャ内でPDFファイルからドキュメントメタデータを抽出、管理、変更することを指します。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、メタデータをドキュメント自体に関する情報として定義しており、タイトル、作成者、作成日、カスタムフィールドなどのプロパティが含まれます。このメタデータをオンプレミスで処理することで、組織は自社のインフラストラクチャ内でデータ主権とセキュリティを維持しながら、ドキュメント情報処理を完全に制御できます。

定義

PDF metadata on-premiseとは、組織が所有するデータセンターまたはプライベートインフラストラクチャに展開されたソフトウェアとシステムを使用して、PDFドキュメントのメタデータを処理する手法です。これには、Document Information Dictionaryからのメタデータの読み取り、XMP(Extensible Metadata Platform)ストリームの抽出、外部のクラウドサービスに依存せずにドキュメントプロパティを変更することが含まれます。クラウドベースのメタデータ処理とは異なり、オンプレミスソリューションではすべてのドキュメント情報処理を組織のセキュリティ境界内に保持します。

( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されているように、PDFメタデータはPDFファイル内に主に2つの形式で存在します。Document Information Dictionary(従来のキー値構造)とXMPメタデータ(XMLベースのより拡張性の高い形式)です。オンプレミス処理ツールは、さまざまなPDFバージョンとの互換性を確保し、ドキュメントワークフロー中にメタデータの整合性を維持するために、両方の形式の読み取りと書き込みが可能でなければなりません。

重要性

エンタープライズドキュメント管理システムを構築する開発者にとって、オンプレミスのメタデータ処理は重要なコンプライアンスとセキュリティ要件に対応します。医療、金融、政府などの規制対象業界の組織では、機密文書を処理のために外部サービスに送信できないことが多く、メタデータの抽出と操作にオンプレミスソリューションが不可欠です。

オンプレミスのメタデータ処理により、開発者は外部依存関係を導入することなく、既存のエンタープライズシステムと直接統合するカスタムワークフローを構築できます。このアプローチにより、レイテンシが削減され、クラウドAPIに関連するドキュメントごとの処理コストが排除され、大量のドキュメント処理シナリオで予測可能なパフォーマンスが提供されます。

オンプレミスのメタデータ管理を理解することは、ドキュメントアクセシビリティ機能を実装する開発者にとって重要です。メタデータはPDF/UAコンプライアンス ( Citation: N.A., (N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) において重要な役割を果たすためです。適切なメタデータ処理により、支援技術がドキュメントプロパティを正しく識別し、ユーザーに不可欠なドキュメント情報を提供できるようになります。

仕組み

オンプレミスのPDFメタデータ処理には、通常、組織のインフラストラクチャ内にPDFライブラリまたはサーバーベースのアプリケーションを展開することが含まれます。開発者は、これらのツールをAPIを通じて統合し、既存のPDFからメタデータを読み取ったり、プロパティを変更したり、ドキュメント生成時に新しいメタデータを埋め込んだりします。

技術的なワークフローは、PDFファイルを開き、その構造を解析してメタデータソースを特定することから始まります。PDFのトレーラーセクションにあるDocument Information Dictionaryには、Title、Author、Subject、Keywords、Creator、Producer、CreationDate、ModDateなどの基本プロパティが含まれています。最新のPDFには、通常ドキュメントカタログに配置されるXMPメタデータストリームも含まれており、名前空間と複雑なプロパティタイプをサポートするより構造化された拡張性の高いメタデータ形式を提供します。

オンプレミスでメタデータを変更する場合、開発者は両方のメタデータ表現が同期されたままであることを確認する必要があります。一方の形式のみに書き込むと、下流のアプリケーションに問題を引き起こす不整合が生じる可能性があります。PDF仕様 ( Citation: N.A., (N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) では、XMPメタデータが存在する場合、それを権威あるものと見なし、Document Information Dictionaryは下位互換性のために維持することを推奨しています。

オンプレミスソリューションには、特定のPDF標準への準拠を保証するためのメタデータ検証が組み込まれることがよくあります。たとえば、Tagged PDFではアクセシビリティ機能を適切にサポートするために特定のメタデータエントリが必要であり ( Citation: , (). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) 、検証ルーチンによって、ドキュメントが本番ワークフローに入る前に、これらの必須プロパティが存在し、正しくフォーマットされていることを確認できます。

関連用語

  • PDF Document Information Dictionary – PDFファイル内の従来のキー値メタデータ構造
  • XMP Metadata – PDFおよびその他のファイル形式で使用される拡張可能なXMLベースのメタデータ形式
  • PDF/UA – 特定のメタデータプロパティを必要とするユニバーサルアクセシビリティのためのPDF標準
  • Tagged PDF – 適切なメタデータに依存する構造情報を含むPDF形式
  • Document Properties – PDFリーダーアプリケーションに表示されるユーザー可視のメタデータフィールド

出典

(N.A.) (2020)
(N.A.). (). Document management — Portable document format — Part 2: PDF 2.0 International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
PDF Association (2023)
(). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
(N.A.) (2014)
(N.A.). (). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html