Анализируйте такие документы, как счета, квитанции или финансовые таблицы, чтобы извлекать текст, изображения и метаданные из более чем 40 популярных форматов документов.
Начать бесплатную пробную версиюGroupDocs.Parser Cloud для Java — это оболочка REST API для извлечения данных из документов для анализа более 50 типов документов. Парсинг документов с предопределенными шаблонами — одна из самых ценных функций GroupDocs.Parser Cloud API. Очень просто и легко определить шаблоны и извлечь данные из счетов-фактур или других типовых документов. API предоставляет методы для извлечения изображений, текста и метаданных практически из всех наиболее распространенных форматов файлов. Наряду с обычными документами вы можете использовать поддерживаемые функции для защищенных паролем файлов и контейнеров, таких как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, пометки и портфолио PDF в ваших приложениях Java.
Проверьте наши Cloud SDK для Java на GitHub, если вы ищете исходный код для анализа файлов в облаке.
Вы можете попробовать GroupDocs.Parser Java API с низким кодом без каких-либо ограничений.
GroupDocs.Parser Cloud также доступен в виде образа Docker, который можно использовать для [самостоятельного размещения] (https://purchase.groupdocs.cloud/self-hosting) сервиса. Или вы можете создавать свои собственные службы, используя GroupDocs.Parser High-code API, которые в настоящее время управляют как нашими бесплатными приложениями, так и REST API.
GroupDocs.Parser Cloud API предоставляет несколько способов извлечения изображений из документов. Вы можете извлечь все изображения из всего документа, извлечь изображения из определенных страниц, установив диапазон страниц. В следующем примере показано, как извлечь изображения из документа внутри контейнера.
// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples