HTMLConversionOptions
HTMLConversionOptionsは、BuildVu APIにおける設定クラスで、開発者がPDFドキュメントをHTML形式に変換する方法をカスタマイズできるようにします。
HTMLConversionOptionsは、BuildVu APIにおける設定クラスで、開発者がPDFドキュメントをHTML形式に変換する方法をカスタマイズできるようにします。このクラスは、HTML出力に対する詳細な制御を提供し、開発者が特定のWebアプリケーション、アクセシビリティ要件、およびプレゼンテーションのニーズに合わせて変換されたドキュメントを最適化できるようにします。これらのオプションを設定することで、開発者は ( Citation: N.A., 2020 (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html ) などの標準に準拠したドキュメントからのテキスト、画像、フォント、構造を含むPDFコンテンツが、Web互換HTMLとしてどのようにレンダリングされるかに影響を与えることができます。
HTMLConversionOptionsは、BuildVu API内のJavaクラスで、HTML変換操作のパラメータオブジェクトとして機能します。複数の出力形式に適用される一般的な変換設定とは異なり、HTMLConversionOptionsは、PDFソースドキュメントからのHTML生成に特化しています。このクラスは、画像処理、フォントのサブセット化、ナビゲーション生成、レスポンシブデザインオプション、およびアクセシビリティ機能などの側面を制御するさまざまなプロパティとメソッドを公開します。 ( Citation: PDF Association, 2023 PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/ ) ガイドラインに従う構造化PDFを扱う際、このクラスはドキュメントのセマンティクスと論理的な読み順序を、生成されるHTML出力に保持するのに役立ちます。他のBuildVuオプションクラス(SVGConversionOptionsやIDRConversionOptionsなど)とは異なり、HTML固有のレンダリングの問題とWebブラウザの互換性に専ら焦点を当てている点で区別されます。
ドキュメント管理システム、デジタル出版プラットフォーム、またはWebベースのPDFビューアを構築する開発者にとって、HTMLConversionOptionsは、変換品質とパフォーマンスに対する重要な制御を提供します。これらのオプションの適切な設定は、ページの読み込み時間、検索エンジン最適化、モバイルレスポンシブ性、およびWCAGなどのWebアクセシビリティ標準への準拠に直接影響します。 ( Citation: N.A., 2014 (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html ) 準拠ドキュメントを変換する際、適切な設定により、アクセシビリティ機能がHTML出力に保持され、エンタープライズアプリケーションや政府システムのコンプライアンス要件が維持されます。変換パラメータを微調整できる機能により、開発者はファイルサイズと視覚的忠実度のバランスを取り、特定のブラウザやデバイスに最適化し、変換されたコンテンツを既存のWebアーキテクチャにシームレスに統合できます。
HTMLConversionOptionsは、PDFからHTMLへの変換プロセスを開始する前にBuildVuコンバータに渡される設定オブジェクトとして動作します。開発者はクラスをインスタンス化し、setterメソッドまたはビルダーパターンを通じて必要なプロパティを設定し、設定されたオブジェクトを変換API呼び出しに提供します。主な設定可能な側面には以下が含まれます:
出力構造: HTMLが単一ページまたは複数ページとして生成されるか、ディレクトリがどのように整理されるか、ファイル命名規則を制御します。
画像処理: 画像形式(PNG、JPEG、WebP)、圧縮レベル、画像がインラインで埋め込まれるか別ファイルとして保存されるかを決定します。
フォント管理: フォントのサブセット化、Webフォント形式(WOFF、WOFF2)、およびフォールバックフォント戦略を設定し、レンダリング精度と帯域幅の考慮事項のバランスを取ります。
ナビゲーションとUI: 変換されたHTMLにおけるナビゲーションコントロール、サムネイル、ブックマーク、および検索機能を有効または無効にします。
アクセシビリティ機能: セマンティックHTMLタグが適切に使用されることを保証し、ドキュメントで見られる論理構造(適切な見出し階層、画像の代替テキスト、必要に応じたARIA属性を含む)を保持します。
変換エンジンはこれらの設定を読み取り、PDF解析とHTML生成パイプライン全体にわたって適用し、PDFオブジェクト、フォント、およびグラフィックを対応するHTML要素、CSSスタイルシート、およびWeb最適化された画像に変換します。
- BuildVu – PDFドキュメントをHTML5、SVG、およびその他のWeb形式に変換するためのIDRのJavaライブラリ
- Tagged PDF – 論理的な読み順序とドキュメント階層を定義する構造メタデータを持つPDFドキュメント
- PDF/UA – ユニバーサルにアクセス可能なPDFドキュメントを作成するためのISO標準
- SVGConversionOptions – SVG固有の変換設定を構成するためのBuildVu APIクラス
- Responsive HTML – 異なる画面サイズやデバイスに適応するHTML出力
- (N.A.) (2020)
- (N.A.). (2020). Document management — Portable document format — Part 2: PDF 2.0 . International Organization for Standardization Retrieved from https://www.iso.org/standard/75839.html
- PDF Association (2023)
- PDF Association(2023). Retrieved from https://pdfa.org/resource/tagged-pdf-best-practice-guide-syntax/
- (N.A.) (2014)
- (N.A.). (2014). Document management applications — Electronic document file format enhancement for accessibility — Part 1: Use of ISO 32000-1 (PDF/UA-1) . International Organization for Standardization Retrieved from https://www.iso.org/standard/64599.html
