NodeJSを使用してPDFから画像を抽出する
このチュートリアルでは、ホストされたJPedalクラウドAPIを使用してPDFから画像を抽出する方法を説明します。独自のセルフホスト型JPedalマイクロサービス をセットアップすることもできます。
上記のサービスは通常のHTTPリクエストでアクセスできますが、このチュートリアルではREST API のシンプルなNodeJSラッパーを提供するオープンソースのNodeJS IDRCloudClient を使用します。
- npmを使用して、以下のコマンドでidrcloudclientパッケージ をインストールします:
npm install --save @idrsolutions/idrcloudclient
- idrcloudclientオブジェクトを作成します
var idrcloudclient = require('@idrsolutions/idrcloudclient');
- endpoint変数を作成します
var endpoint = 'https://my-self-hosted-service.com/' + idrcloudclient.JPEDAL;
- ファイルをアップロードするためのParametersマップを作成します
var parameters = {
input: idrcloudclient.UPLOAD,
file: 'path/to/exampleFile.pdf',
settings: '{"mode":"extractImages","type":"rawImages","format":"png"}'
}
- [オプション] 進捗、成功、失敗時にトリガーされるリスナーを作成します。
function progressListener(e) {
console.log(JSON.stringify(e));
}
function failureListener(e) {
console.log(e);
console.log('Failed!');
}
function successListener(e) {
console.log(JSON.stringify(e));
console.log('Download URL: ' + e.downloadUrl);
}
- 前述で作成した変数を使用してconvertメソッドを呼び出します
idrcloudclient.convert({
endpoint: endpoint,
parameters: parameters,
// 以下はオプションのリスナーです。定義していないものは無視してください
progress: progressListener,
success: successListener,
failure: failureListener
});
JPedalマイクロサービスは、抽出完了時に抽出のステータス
を送信するためのコールバックURLを受け付けます。コールバックURLを使用することで、抽出が完了したかどうかを判断するためにサービスをポーリングする必要がなくなります。
コールバックURLは以下のようにparameters変数に指定できます。
var parameters = {
input: idrcloudclient.UPLOAD,
callbackUrl: 'http://listener.url',
file: 'path/to/exampleFile.pdf',
settings: '{"mode":"extractImages","type":"rawImages","format":"png"}'
}
上記のセクションの手順に基づいて、PDFから画像を抽出する完全なコード例を以下に示します。設定オプションと高度な機能については、以降のセクションをご覧ください。
var idrcloudclient = require('@idrsolutions/idrcloudclient');
function progressListener(e) {
console.log(JSON.stringify(e));
}
function failureListener(e) {
console.log(e);
console.log('Failed!');
}
function successListener(e) {
console.log(JSON.stringify(e));
console.log('Download URL: ' + e.downloadUrl);
}
var endpoint = 'https://my-self-hosted-service.com/' + idrcloudclient.JPEDAL;
var parameters = {
input: idrcloudclient.UPLOAD,
file: 'path/to/exampleFile.pdf',
settings: '{"mode":"extractImages","type":"rawImages","format":"png"}'
}
idrcloudclient.convert({
endpoint: endpoint,
parameters: parameters,
// 以下は利用可能なリスナーです
progress: progressListener,
success: successListener,
failure: failureListener
});
JPedal APIは、抽出をカスタマイズするためのキーと値のペアの設定オプションを含む文字列化されたJSONオブジェクトを受け付けます。設定はparameters配列に追加する必要があります。PDFから画像を抽出するための設定オプションの完全なリストはこちら で確認できます。
settings: '{"key":"value","key":"value"}'
ローカルファイルをアップロードする以外に、JPedalマイクロサービスがダウンロードして抽出を実行するURLを指定することもできます。これを行うには、parameters変数のinputとfileの値を以下のように置き換える必要があります。
input: IDRCloudClient.DOWNLOAD
url: 'http://exampleURL/exampleFile.pdf'
PDFから画像を抽出するためにユーザー名とパスワードを必要とする独自のJPedalマイクロサービスをデプロイした場合、各変換時にそれらを提供する必要があります。これらは、以下に示すようにconvertメソッドにusernameとpasswordという2つの変数を渡すことで提供されます。
username: 'username',
password: 'password',
GitHubのIDRCloudClient
NPMのIDRCloudClient
JPedalマイクロサービスAPI
JPedalマイクロサービスの使用方法
