IDRViewerは、IDRの変換ツール(BuildVuなど)によってHTML5形式に変換されたPDF文書をレンダリングするJavaScriptベースのビューアコンポーネントです。変換されたPDFページをナビゲートするためのインタラクティブなインターフェースを提供し、テキスト検索、サムネイル、ページナビゲーションなどの機能を備えています。PDFは
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
のような文書構造の標準規格に準拠していますが、IDRViewerはこのコンテンツを標準的なブラウザからアクセス可能なWeb ネイティブ形式で表示します。
IDRViewerは、IDRのサーバーサイド変換APIによってHTML5、SVG、JavaScriptに変換されたPDF文書を表示するクライアントサイドJavaScriptアプリケーションです。ネイティブPDFファイルをレンダリングする従来のPDFビューアとは異なり、IDRViewerは事前に変換されたコンテンツのみを扱い、ページをWeb標準のマークアップとして表示します。このビューアはプレゼンテーション層を処理し、ページめくり、ズーム、検索、サムネイルナビゲーションといった使い慣れたPDFナビゲーション機能をユーザーに提供します。すべての処理はブラウザ内で完結し、PDFレンダリングエンジンやプラグインを必要としません。この点が、
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
仕様に準拠したPDFファイルを直接扱う埋め込みPDFビューアやブラウザネイティブのPDF表示機能との違いです。
JPedalは、IDR Solutionsが開発した商用JavaPDFライブラリで、PDFドキュメントの表示、レンダリング、テキストと画像の抽出、プログラムによる処理のための包括的な機能を提供します。開発者は、外部依存関係やネイティブコードを必要とせずに、PDF対応アプリケーションを構築できます。JPedalは
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
仕様を完全にサポートし、を含む複雑なPDF構造を処理するための特化した機能を備えています。
JPedalは、PDF操作とレンダリングのための完全なツールキットを提供する純粋なJava PDFライブラリです。ブラウザベースのPDFビューアや軽量レンダリングライブラリとは異なり、JPedalは高精度なPDFレンダリング、位置情報を含む包括的なテキスト抽出、画像抽出、各種フォーマットへのPDF変換、フォーム処理機能などのエンタープライズグレードの機能を提供します。このライブラリはネイティブバイナリを必要とせず完全にJavaで動作するため、プラットフォームに依存せず、サーバーサイド処理、デスクトップアプリケーション、クラウド展開に適しています。JPedalは、本番環境対応のパフォーマンス、広範なPDF仕様のカバレッジ、コンテンツストリームの解析やドキュメント構造分析などの高度な機能を提供することで、基本的なPDFライブラリとは一線を画しています。
PDFドキュメントの処理、表示、またはデータ抽出を必要とするアプリケーションを構築する開発者にとって、JPedalはPDF仕様の詳細を実装する複雑さを排除する、信頼性の高い自己完結型のソリューションを提供します。正確な位置情報を持つテキストを抽出できるライブラリの機能は、ドキュメント分析、データマイニング、コンテンツインデックス作成アプリケーションにとって価値があります。そのレンダリング機能により、開発者はブラウザへの依存なしに、PDFビューア、サムネイル生成ツール、ドキュメント変換ツールを作成できます。JPedalのアクセシビリティ機能と
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
準拠のサポートは、アクセシビリティ要件を満たす必要がある組織にとって特に重要です。純粋なJava実装により、異なるオペレーティングシステムやコンテナ化された環境での展開が簡素化され、インフラストラクチャの複雑さと保守オーバーヘッドが軽減されます。
JPedalベストプラクティスは、JPedal Javaライブラリを使用してPDFファイルを効率的に処理するための推奨される技術とパターンのセットです。これらのプラクティスは、
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
を含むさまざまな規格に準拠する可能性のあるPDF文書を扱う際の、パフォーマンスの最適化、メモリ管理、リソース処理に焦点を当てています。確立されたベストプラクティスに従うことで、異なる文書タイプや複雑さのレベルにおいて、信頼性の高いPDFレンダリング、変換、データ抽出が保証されます。
JPedalベストプラクティスは、JavaベースのPDF処理機能を提供するJPedal PDFライブラリ専用に設計された実証済みの開発パターンです。これらのプラクティスは、JPedalライブラリ固有のAPIアーキテクチャ、メモリモデル、パフォーマンス特性に対応することで、一般的なPDF開発ガイドラインとは異なります。適切なオブジェクトライフサイクル管理、デコーダー設定、色空間の処理、画像抽出の最適化、マルチスレッド処理アプローチなどの領域をカバーしています。一般的なJava最適化技術とは異なり、JPedalベストプラクティスは、不正な形式の文書の処理、大容量ファイル処理の管理、透明度、フォームフィールド、埋め込みフォントなどの複雑なPDF機能の効率的な処理など、PDFパース特有の課題を考慮しています。
JPedalベストプラクティスの実装は、本番環境レベルのPDF処理アプリケーションを構築する開発者にとって不可欠です。不適切な実装は、大規模または複雑なPDFファイルを処理する際に、メモリリーク、処理速度の低下、アプリケーションのクラッシュを引き起こす可能性があります。ベストプラクティスに従うことで、特にサーバー環境や数百から数千の文書を連続して処理するバッチ処理シナリオにおいて、最適なリソース利用が保証されます。これらのプラクティスは、不適切なデコーダークリーンアップ、非効率なページレンダリング、最適化されていないキャッシング戦略などの一般的な落とし穴を回避するのにも役立ちます。
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
に準拠するアクセシブルなPDFや、
(
Citation: PDF Association, 2023
PDF Association(2023). Retrieved from
https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
)
で説明されている複雑なタグ付き構造を持つ文書を処理する必要があるアプリケーションでは、パフォーマンスと精度の両方を維持するために、適切なJPedalの設定と使用パターンがさらに重要になります。
JPedal pipelineは、JPedal Java PDFライブラリ内の処理アーキテクチャであり、生のファイルデータから解析、レンダリング、出力生成に至るまで、PDFコンテンツを順次変換します。このpipelineは、PDF仕様
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で定義された構造化アプローチに従い、PDFオブジェクト、グラフィックスオペレーター、コンテンツストリームをデコードして解釈します。このpipelineアーキテクチャにより、開発者はPDF文書を閲覧、変換、またはコンテンツ抽出タスクのために体系的に処理できます。
JPedal pipelineは、PDFファイルデータを使用可能な出力形式に変換する多段階処理システムです。その中核として、pipelineは明確な段階で構成されています:ファイル解析(PDF構造とクロスリファレンステーブルの読み取り)、オブジェクトデコード(辞書、配列、ストリームなどのPDFオブジェクトの解釈)、コンテンツストリーム処理(グラフィックスオペレーターの実行)、レンダリング(ベクターおよびラスターコンテンツの表示可能な形式への変換)、出力生成(画像、テキスト、またはその他の派生形式の生成)です。
モノリシックなPDF処理アプローチとは異なり、JPedal pipelineはモジュラーアーキテクチャを使用し、各段階が特定の責任を持ち、処理されたデータを後続の段階に渡します。これは、中間処理レイヤーなしでPDFコンテンツを直接表示しようとする直接レンダリングシステムとは異なります。pipelineの構造化アプローチにより、開発者は特定の段階でデータを傍受、変更、または抽出でき、カスタムPDF処理ワークフローに柔軟性を提供します。
JPedal pipelineの理解は、PDF処理動作をカスタマイズしたり、特定の文書タイプに対してパフォーマンスを最適化したり、特定のコンテンツ要素を抽出したりする必要がある開発者にとって重要です。pipelineアーキテクチャは、処理速度、メモリ使用量、レンダリング出力の品質に直接影響します。Tagged PDFコンテンツ構造やアクセシビリティ機能
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
を持つ文書などの複雑なPDFを扱う開発者は、セマンティック情報を適切に抽出したり、変換中に文書構造を維持したりするために、データがpipelineをどのように流れるかを理解する必要があります。
JPedal workflowとは、JPedal Java PDFライブラリを使用してアプリケーション内でPDFコンテンツをレンダリング、抽出、操作する体系的なプロセスを指します。このworkflowにより、開発者は
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
などの標準に準拠したPDFファイルにプログラム的にアクセスして処理し、Web表示、データ抽出、またはさらなる処理に適した形式に変換できます。このworkflowには通常、JPedalライブラリの初期化、PDF文書の読み込み、アプリケーション要件に基づく特定の操作の実行が含まれます。
JPedal workflowとは、開発者がJPedalライブラリの機能をアプリケーションに統合する際に従う操作シーケンスです。PDF文書の取り込みから処理、出力生成に至るまでの完全なライフサイクルを包含します。単純なPDF表示ソリューションとは異なり、JPedal workflowはPDFレンダリング、テキスト抽出、画像抽出、フォームデータ処理に対するプログラム的な制御を提供します。このworkflowは、
(
Citation: PDF Association, 2023
PDF Association(2023). Retrieved from
https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
)
で説明されているTagged PDFを含む複雑なPDF構造を処理できるように設計されており、処理中に文書の忠実性とアクセシビリティ機能を維持することができます。これは、外部依存関係やコマンドラインツールを必要とせず、Java ベースの直接操作を提供する点で、他のPDF処理アプローチとは異なります。
Jpeg2000Metadataは、JDeliライブラリにおける特化したメタデータクラスであり、JPEG 2000画像ファイル内に埋め込まれたメタデータ情報の抽出と表現を処理します。このクラスは、画像プロパティ、色空間情報、および適切な画像処理とレンダリングに不可欠なその他の技術的属性への構造化されたアクセスを開発者に提供します。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で規定されているJPEG 2000圧縮画像を含むPDF文書を扱う際、このメタデータクラスは、表示、変換、およびアクセシビリティ目的のために画像データの正確な解釈を保証します。
Jpeg2000Metadataは、JDeliのメタデータ処理フレームワーク内の具象実装クラスであり、JPEG 2000(JP2およびJPX)画像フォーマットからメタデータを具体的に解析および保存します。汎用の画像メタデータクラスとは異なり、Jpeg2000Metadataは、ボックスベースのフォーマット、複数の色空間のサポート、解像度レベル、埋め込みICCプロファイルなどの高度な機能を含む、JPEG 2000ファイルの独自の構造を理解します。このクラスは、画像の寸法、ビット深度、圧縮パラメータ、色変換データ、およびJPEG 2000ファイル構造内に埋め込まれている可能性のあるXMPまたはEXIFメタデータなどの技術情報をカプセル化します。この特化した処理は非常に重要です。なぜなら、PDF内のJPEG 2000画像には、画像をどのようにデコードおよびレンダリングすべきかに影響する複雑なメタデータが含まれる可能性があり、特に
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
で概説されているアクセシビリティ準拠を必要とするコンテキストにおいて重要だからです。
JpegxlMetadataは、JDeli画像ライブラリ内の特殊なメタデータクラスで、JPEG XL画像ファイルからメタデータ情報を抽出し表現する役割を担います。埋め込み画像を含むPDF文書を扱う際、
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
などのPDF標準への適切な文書処理とコンプライアンスのために、画像メタデータの理解は極めて重要です。このクラスは、JPEG XL形式の画像内に保存された技術的および記述的情報へのプログラマティックなアクセスを開発者に提供します。
JpegxlMetadataは、JPEG XL画像形式をサポートするためにJDeliのメタデータフレームワークを拡張したJavaクラスです。色空間情報、画像寸法、ビット深度、向き、その他の形式固有のプロパティなど、JPEG XLファイル内に埋め込まれたメタデータを解析し公開します。汎用的な画像メタデータハンドラとは異なり、JpegxlMetadataは、可逆圧縮と非可逆圧縮の両方を提供する最新の画像コーデックであるJPEG XL形式の独自のメタデータ構造と機能を理解するように特別に設計されています。このクラスは、JDeliの広範な画像処理機能の一部として機能し、開発者がPDF文書内に埋め込まれたJPEG XL画像を調査したり、独立して処理したりすることを可能にします。メタデータ抽出は画像デコード中に行われ、文書レンダリング、アクセシビリティ、またはアーカイブ目的に関連する可能性のあるプロパティへの構造化されたアクセスを提供します。
BuildVuやJDeliなどのPDF処理ライブラリを使用する開発者にとって、画像メタデータの理解はいくつかの理由から不可欠です。第一に、メタデータは、
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
仕様に従って画像が正しく表示されるように、PDF文書内で正確な画像レンダリングに必要な重要な情報を提供します。第二に、
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
などの標準に準拠したアクセシブルなPDFを作成する際、画像メタデータは適切な代替テキストと構造要素の生成に役立ちます。第三に、メタデータアクセスにより、開発者はPDF操作操作中の画像最適化、形式変換、品質保持について情報に基づいた意思決定を行うことができます。JpegxlMetadataクラスは、JPEG XLの採用が増加する中で特に重要であり、開発者が重要な画像プロパティへのアクセスを犠牲にすることなく、PDFワークフローでこの最新の画像形式をサポートするために必要なツールを提供します。
PngMetadataは、JDeli画像ライブラリにおける特殊なメタデータクラスで、PNG(Portable Network Graphics)画像ファイルから抽出されたメタデータへの構造化されたアクセスを提供します。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で定義されているPDFドキュメント内に埋め込まれた画像を処理する際、開発者は適切なレンダリング、アクセシビリティ準拠、および画像最適化を確保するために、フォーマット固有のメタデータにアクセスする必要があります。PngMetadataは、色タイプ、ビット深度、ガンマ補正値、テキストメタデータチャンクなどのPNG固有のプロパティをカプセル化します。
PngMetadataは、JDeli API内のJavaクラスで、PNG画像ファイルから解析されたメタデータのコンテナとして機能します。汎用的な画像メタデータクラスとは異なり、PngMetadataは、チャンクベースのメタデータ構造、透過情報(tRNSチャンク)、埋め込みICCカラープロファイル、PNG固有のテキスト注釈(tEXt、zTXt、iTXtチャンク)を含むPNGフォーマットの特性を処理するために特別に設計されています。このクラスは、PNGバイナリ構造を手動で解析する必要なく、PNGプロパティへの型安全なアクセサを提供します。これは、インターレース方式、フィルタタイプ、圧縮レベルなど、PNG仕様に固有の属性を公開することで、より汎用的なメタデータアプローチとは異なります。
埋め込まれたPNG画像を含むPDFドキュメントを扱う開発者にとって、PngMetadataは画像処理ワークフローに不可欠な情報を提供します。PNGメタデータの理解は、PDFから画像を抽出してWeb表示する際、ICCプロファイル管理を通じて色の正確性を確保する際、または
(
Citation: N.A., 2014
(N.A.).
(2014).
Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1)
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/64599.html
)
で概説されているアクセシビリティ要件を維持する際に重要です。このメタデータクラスにより、開発者は画像のトランスコーディングについて情報に基づいた決定を行い、圧縮設定を分析してファイルサイズを最適化し、フォーマット変換中に重要な画像属性を保持できます。PNG固有のメタデータへのアクセスは、画像レンダリングの問題のデバッグや、元の画像作成者の意図を尊重するカスタム画像処理パイプラインの実装も容易にします。
PsdMetadataは、JDeliライブラリにおける特殊なメタデータクラスで、Adobe Photoshop Document(PSD)画像ファイルからのメタデータ情報の抽出と解析を処理します。このクラスは、開発者に埋め込まれた画像プロパティへのプログラマティックなアクセスを提供し、PDFワークフロー内でPSDファイルを処理する際の効率的なメタデータ取得を可能にします。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
では直接参照されていませんが、メタデータ処理はPDF処理パイプラインにおけるドキュメント構造とアクセシビリティの維持に不可欠です。
PsdMetadataは、JDeliのメタデータ処理フレームワークを拡張し、Adobe Photoshopの独自PSD形式を特別にサポートするJavaクラスです。PSDファイル内に埋め込まれたメタデータフィールドを解析して公開し、画像の寸法、カラーモード、ビット深度、レイヤー情報、その他Photoshop形式固有の技術的プロパティなどが含まれます。JPEGやPNGなどの一般的な形式を扱う汎用画像メタデータクラスとは異なり、PsdMetadataは複数のレイヤー、チャンネル、広範な編集情報を含むことができるPSDファイルの複雑な階層構造を解釈するように調整されています。この特殊なクラスは、IDRスイート内のJDeliの広範な画像処理機能の一部を形成し、開発者が正確な画像変換やPDF生成ワークフローに重要となる可能性のある形式固有の情報を抽出できるようにします。
PDF生成や画像処理パイプラインを扱う開発者にとって、PsdMetadataはプロフェッショナルなデザインファイルを処理するための重要な機能を提供します。多くのグラフィックデザインワークフローはAdobe Photoshopで作成されるため、PSDファイルから正確なメタデータを抽出できることで、画像が適切な設定で正しく処理、変換され、PDFに埋め込まれることが保証されます。これは、色精度の維持、解像度情報の保持、またはPDF作成時のレイヤー統合に関する判断を行う際に特に重要です。PSD固有のメタデータへのアクセスにより、開発者は画像プロパティに基づく条件付きロジックの実装、ファイル特性に基づく処理の最適化、最終的なPDF出力における画像品質やレンダリングに関連する問題のトラブルシューティングが可能になります。
search.jsonは、BuildVuがPDF変換時に自動生成するインデックスファイルで、すべてのページをメモリに読み込むことなく、変換されたドキュメント全体で全文検索機能を実現します。このJSON形式のファイルには、ソースPDFドキュメントから抽出されたインデックス化されたコンテンツとメタデータが含まれ、利用可能な場合はTagged PDF構造からのテキストも含まれます。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
はPDFドキュメントの内部構造を定義していますが、search.jsonはWebベースのPDFビューアアプリケーション専用に最適化された検索インデックスとして機能します。
search.jsonは、BuildVuがPDFからHTML5への変換プロセスの一部として作成する構造化されたJSONファイルです。このファイルには、PDFから抽出されたすべてのテキストコンテンツの検索可能なインデックスが含まれ、個々のページリソースを読み込むことなく高速なキーワード検索を可能にする形式で整理されています。
(
Citation: N.A., 2020
(N.A.).
(2020).
Document management — Portable document format — Part 2: PDF 2.0
.
International Organization for Standardization
Retrieved from
https://www.iso.org/standard/75839.html
)
で定義されたドキュメント構造全体にアクセスする必要がある従来のPDF検索方法とは異なり、search.jsonはWebアプリケーション向けに最適化された、事前処理済みの軽量なインデックスを提供します。