cURLを使用してPDFから画像を抽出する
以下のチュートリアルでは、ホストされたJPedalクラウドAPIを使用してPDFから画像を抽出する方法を説明します。独自のセルフホスト型JPedalマイクロサービス
をセットアップすることができます。
以下の例では、URLとして https://my-self-hosted-service.com/JPedal
を使用しますが、これをセルフホストサービスのURLに置き換える必要があります。
上記のサービスは、REST API を使用してcURLでアクセスできます。
始める前に、cURLがインストールされていることを確認する必要があります。セットアップは、使用しているオペレーティングシステムによって異なります。詳細はcurlウェブサイト で確認できます。
これは、PDFから画像を抽出するための基本的なコード例です。
ファイルエントリは、’@‘の後にファイルへのパス(絶対パスまたは相対パス)を続ける必要があることに注意してください。
設定オプションと高度な機能は以下にあります。
curl -X POST -F input="upload" -F file="@/path/to/file/myfile.pdf" -F settings="{\"mode\":\"convertToImages\",\"format\":\"png\"}" https://my-self-hosted-service.com/jpedal
注意:settingsの形式は、使用しているプラットフォームによって異なります。以下の設定オプションを参照してください。
レスポンスは、uuidを含むJSON形式になります。
{"uuid" : "aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa"}
これを使用して、抽出の進行状況をポーリングし、抽出が完了したら出力のURLを取得できます。
curl https://my-self-hosted-service.com/jpedal?uuid=aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa
レスポンスはJSON形式で、以下の詳細が提供されます。
{
"state" : "processed",
"downloadUrl" : "output/aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa/myfile.zip",
"previewUrl" : "output/aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa/myfile/index.html"
}
previewURLを使用して、ブラウザで出力をプレビューできます。
ダウンロードURLを使用して、変換された出力をダウンロードすることもできます。これは、以下のcURLリクエストで実行できます。
# ファイルを現在のディレクトリに元の名前でダウンロードします。この場合は "myfile.zip"
curl https://my-self-hosted-service.com/jpedal/output/aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa/myfile.zip -LO --output "output.zip"
JPedalマイクロサービスは、抽出完了時にそのステータス
を送信するためのコールバックURLを受け入れます。コールバックURLを使用すると、抽出がいつ完了したかを判断するためにサービスをポーリングする必要がなくなります。
コールバックURLは以下のように提供できます。
curl -X POST -F input="upload" -F callbackUrl="http://listener.url" -F file="@/path/to/file/myfile.pdf" -F settings="{\"mode\":\"convertToImages\",\"format\":\"png\"}" https://my-self-hosted-service.com/jpedal
JPedal APIは、抽出をカスタマイズするためのキーと値のペアの設定オプションを含む文字列化されたJSONオブジェクトを受け入れます。設定は、cURLコマンドのURLの前に追加する必要があります。PDFから画像を抽出するための設定オプションの完全なリストはこちら にあります。
二重引用符のエスケープ構文は使用する環境によって異なる場合がある ことに注意してください。特定の環境で機能するものを必ず確認してください。
PowerShellの場合、解析エラーを回避するために、コマンドを
curl.exe --%で開始する必要があることに注意してください。
ローカルファイルをアップロードするだけでなく、JPedalマイクロサービスがダウンロードして抽出を実行するURLを提供することもできます。これを行うには、inputとfileの値を以下に置き換える必要があります。
-F input=download -F url="http://exampleURL/exampleFile.pdf"
PDFから画像を抽出するためにユーザー名とパスワードが必要な独自のJPedalマイクロサービスをデプロイした場合、各変換でそれらを提供する必要があります。これらは、URLの前にユーザー名とパスワードを含むuserフラグを追加することで提供されます。
--user username:password
