GroupDocs.Parser Cloud for Java 是文档数据提取 REST API 的包装器,用于解析 50 多种文档类型。使用预定义模板解析文档是 GroupDocs.Parser Cloud API 最有价值的功能之一。定义模板并从发票或其他类型的典型文档中提取数据非常简单易行。 API 提供了从几乎所有最常见的文件格式中提取图像、提取文本和元数据的方法。除了常规文档之外,您还可以在 Java 应用程序中使用受密码保护的文件和容器(如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合)的支持功能。
如果您正在寻找用于解析云端文件的源代码,请在 GitHub 查看我们的 Java 云 SDK。
您可以 试用 GroupDocs.Parser 低代码 Java API,没有任何限制。
GroupDocs.Parser Cloud 也可用作 Docker 映像,可用于 自托管 服务。或者,您可以使用 GroupDocs.Parser 高代码 API 构建您自己的服务,这些 API 目前驱动着我们的免费应用程序和 REST API。
GroupDocs.Parser Cloud API,提供了几种从文档中提取图像的方法。您可以从整个文档中提取所有图像,通过设置页面范围从特定页面中提取图像。以下示例显示了如何从容器内的文档中提取图像。
// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples