請求書、領収書、財務表などのドキュメントを解析して、40以上の一般的なドキュメント形式からテキスト、画像、メタデータを抽出します。
無料トライアルを開始GroupDocs.Parser Cloud for Javaは、50を超えるドキュメントタイプを解析するためのドキュメントデータ抽出RESTAPIのラッパーです。事前定義されたテンプレートを使用したドキュメントの解析は、GroupDocs.ParserCloudAPIの最も価値のある機能の1つです。テンプレートを定義し、請求書やその他の種類の一般的なドキュメントからデータを抽出するのは非常にシンプルで簡単です。 APIは、ほとんどすべての最も一般的なファイル形式から画像を抽出し、テキストとメタデータを抽出するメソッドを提供します。通常のドキュメントに加えて、パスワードで保護されたファイルや、JavaアプリケーションのZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのコンテナでサポートされている機能を使用できます。
クラウドでファイルを解析するためのソース コードを探している場合は、GitHub で Java 用のクラウド SDK を確認してください。
GroupDocs.Parser を試す ローコード Java API を制限なく使用できます。
GroupDocs.Parser Cloud は、サービスを セルフホスト するために使用できる Docker イメージとしても利用できます。または、GroupDocs.Parser ハイコード API を使用して独自のサービスを構築することもできます。これは現在、無料アプリと REST API の両方を駆動しています。
GroupDocs.Parser Cloud APIは、ドキュメントから画像を抽出するいくつかの方法を提供します。ページ範囲を設定することで、ドキュメント全体からすべての画像を抽出したり、特定のページから画像を抽出したりできます。次の例は、コンテナ内のドキュメントから画像を抽出する方法を示しています。
// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples