Security extraction
セキュリティ抽出とは、PDFドキュメントにおいて、テキスト、画像、その他の埋め込みデータなどのコンテンツをファイルから抽出する機能を制限する権限制御を指します。
セキュリティ抽出とは、PDFドキュメントにおいて、テキスト、画像、その他の埋め込みデータなどのコンテンツをファイルから抽出する機能を制限する権限制御を指します。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているように、これらの権限はPDF暗号化辞書の一部であり、ユーザーパスワードと所有者パスワードによって強制できます。このセキュリティ対策は、コンテンツ制作者が知的財産を保護しながら、ドキュメントの閲覧と共有を可能にするものです。
セキュリティ抽出とは、PDFの暗号化およびセキュリティフレームワーク内の特定の権限フラグであり、ユーザーがPDFドキュメントからコンテンツをコピーまたは抽出できるかどうかを制御します。抽出が無効になっている場合、ユーザーはテキストの選択とコピー、画像の保存、またはコンテンツ抽出に依存するアクセシビリティ機能の使用が制限されます。これは、ドキュメント全体を開くことから保護する一般的なPDF暗号化や、物理的または仮想プリンタへの出力のみを制御する印刷制限とは異なります。抽出権限は通常、PDFのセキュリティハンドラーによって管理され、ドキュメントが正しいパスワードまたは資格情報で開かれたかどうかに基づいてアクセス制御を強制します。
PDF生成、操作、またはビューアアプリケーションを扱う開発者にとって、セキュリティ抽出を理解することは、いくつかの理由から重要です。第一に、PDF作成ツールを構築する際、開発者は抽出権限に関するコンテンツ制作者の意図を尊重するために、適切なセキュリティハンドラーを実装する必要があります。第二に、テキスト抽出ツール、スクリーンリーダー、コンテンツ管理システムなど、PDFを処理するアプリケーションは、セキュリティポリシーに準拠するために、これらの権限を確認して尊重する必要があります。第三に、開発者は、アクセシビリティ要件が抽出制限と競合する可能性があることを理解する必要があります。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) では、セキュリティ設定に関係なく、支援技術がドキュメントコンテンツにアクセスできることが要求されているためです。
PDFドキュメントは、暗号化辞書の権限(P)エントリを通じてセキュリティ抽出を実装します。このエントリには、さまざまな操作を制御するビットフラグのセットが含まれています。具体的には、ビット5がアクセシビリティ目的のコンテンツ抽出を制御し、ビット10が一般的なコンテンツのコピーと抽出を制御します。PDFにセキュリティが適用されている場合、ビューアまたは処理アプリケーションは、適切なパスワードを使用してドキュメントを復号化し、抽出操作を許可する前にこれらの権限ビットを確認する必要があります。所有者パスワードが提供されている場合、すべての制限は通常バイパスされますが、ユーザーパスワードのみ(またはセキュリティはあるがユーザーパスワードがないドキュメントの場合はパスワードなし)の場合、アプリケーションは制限を強制する必要があります。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によると、準拠リーダーはこれらのフラグを尊重すべきですが、仕様ではPDF暗号化が絶対的なセキュリティを保証するものではないことを認めています。 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で説明されているTagged PDFを扱う場合、開発者は抽出制限とドキュメント構造のアクセシビリティを維持する必要性のバランスを取る必要があります。
- Encryption(暗号化) – パスワード保護と権限制御によってPDFコンテンツを保護するプロセス
- User permissions(ユーザー権限) – ユーザーがPDFドキュメントで実行できる操作を定義するフラグのセット
- Security handler(セキュリティハンドラー) – PDFセキュリティポリシーの実装と強制を担当するコンポーネント
- Content extraction(コンテンツ抽出) – PDFドキュメントからテキスト、画像、またはその他のデータを取得するプロセス
- Owner password(所有者パスワード) – PDFドキュメントへの完全なアクセスを許可し、すべての制限をバイパスするパスワード
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
