Page range (real page numbering)
Page range(実ページ番号方式)は、PDF文書から特定のページ範囲を抽出または処理する際に、元の文書の実際のページ番号を維持する変換機能です。
Page range(実ページ番号方式)は、PDF文書から特定のページ範囲を抽出または処理する際に、元の文書の実際のページ番号を維持する変換機能です。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で定義されているPDF文書を扱う際、この機能により、ページラベルや論理的なページ番号が元の文書構造と一致した状態を保ち、ページ1から始まる連番に振り直されることがありません。
Page range(実ページ番号方式)は、PDF文書からページの一部を抽出または変換する際に、元のPDFの実際のページ番号体系を保持する変換オプションです。ページを連番で振り直す単純なページ範囲抽出(例:10〜15ページを抽出して1〜6ページに振り直す)とは異なり、この機能は元のページ番号(10〜15のまま)を維持します。
この機能は、前付けにローマ数字(i、ii、iii)を使用し、本文にアラビア数字を使用するようなカスタムページ番号体系を持つPDF文書や、 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) で規定されている文書カタログのPageLabelsエントリを通じて定義された複雑なラベリングシステムを持つ文書を扱う際に特に重要です。
この機能は、ページ番号の意味的な側面を保持する点で標準的なページ抽出とは異なります。これは特に、正確な文書構造とナビゲーションの維持が不可欠な ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) などの規格に準拠したアクセシブルPDFに関連します。
PDF処理ワークフローを構築する開発者にとって、実ページ番号の保持はいくつかの実用的な理由から重要です。
文書の整合性:法的文書、学術論文、技術マニュアルからセクションを抽出する際、元のページ参照を維持することで、引用、相互参照、目次のエントリが正確かつ意味のある状態を保ちます。
アクセシビリティコンプライアンス: ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 規格に準拠したアクセシブルPDFは、スクリーンリーダーや支援技術のために適切なページラベリングに依存することがよくあります。元のページ番号を保持することで、障害を持つユーザーが一貫して文書をナビゲートできるようになります。
マルチドキュメントワークフロー:文書が分割、結合、またはバッチ処理される企業環境において、実ページ番号を維持することで、異なるシステムコンポーネントやユーザーが同じページを明確に参照でき、混乱やエラーを防ぎます。
監査証跡とバージョン管理:規制産業において、元のページ番号を保持することは、文書が処理またはアーカイブされる際の明確な監査証跡の維持に役立ち、元の資料へのトレーサビリティを確保します。
Page range(実ページ番号方式)機能は、元のPDF文書からPageLabels辞書を保持または再構築することで動作します。 ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) によると、文書カタログのPageLabelsエントリは、文書全体でページがどのように番号付けされラベル付けされるかを定義します。
開発者が実ページ番号を有効にしてページ範囲を指定すると、以下の処理が行われます。
- ページ選択:変換プロセスがPDF文書構造内で要求された物理的なページインデックスを識別します
- ラベルの保持:システムが元の文書のPageLabels辞書から対応するページラベルを抽出または計算します
- メタデータの保持:元のページ番号情報が出力文書の構造内に維持されます
- 参照の一貫性:内部リンク、ブックマーク、ナビゲーション要素が保持されたページ番号を反映するように調整されます
基本的なメカニズムには、PageLabels数値ツリーの関連部分のコピー、または元の文書の設定に基づくラベルスタイル(10進数、ローマ数字、アルファベットなど)の再計算が含まれる場合があります。これにより、ページ参照が純粋に連続的なものではなく、意味的に意味のあるものとして維持されます。
( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) で説明されているTagged PDFの場合、このプロセスは論理構造要素と対応するページ番号との関係も維持し、文書構造が損なわれないようにします。
- Page labels – PDF文書内のページに適用される命名および番号付け体系
- Document catalog – ページラベルを含む他のオブジェクトへの参照を含むPDF文書のルートオブジェクト
- Page tree – PDF内のページの順序とプロパティを定義する階層構造
- Logical structure – ページ番号に関連するTagged PDF内のコンテンツの意味的な構成
- PDF accessibility – 障害を持つ人々がPDF文書を使用できるようにするための規格と実践
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
