Анализ и извлечение с помощью REST API и Java SDK

Анализируйте такие документы, как счета, квитанции или финансовые таблицы, чтобы извлекать текст, изображения и метаданные из более чем 40 популярных форматов документов.

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Начать бесплатную пробную версию

GroupDocs.Parser Cloud для Java — это оболочка REST API для извлечения данных из документов для анализа более 50 типов документов. Парсинг документов с предопределенными шаблонами — одна из самых ценных функций GroupDocs.Parser Cloud API. Очень просто и легко определить шаблоны и извлечь данные из счетов-фактур или других типовых документов. API предоставляет методы для извлечения изображений, текста и метаданных практически из всех наиболее распространенных форматов файлов. Наряду с обычными документами вы можете использовать поддерживаемые функции для защищенных паролем файлов и контейнеров, таких как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, пометки и портфолио PDF в ваших приложениях Java.

Часто задаваемые вопросы

Я хочу создать собственное Java-приложение, которое может анализировать файлы онлайн?

Проверьте наши Cloud SDK для Java на GitHub, если вы ищете исходный код для анализа файлов в облаке.

Могу ли я бесплатно попробовать REST API GroupDocs.Parser на Java?

Вы можете попробовать GroupDocs.Parser Java API с низким кодом без каких-либо ограничений.

Я не хочу никуда загружать свои конфиденциальные файлы? Каковы мои варианты?

GroupDocs.Parser Cloud также доступен в виде образа Docker, который можно использовать для [самостоятельного размещения] (https://purchase.groupdocs.cloud/self-hosting) сервиса. Или вы можете создавать свои собственные службы, используя GroupDocs.Parser High-code API, которые в настоящее время управляют как нашими бесплатными приложениями, так и REST API.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечение изображений из документа

GroupDocs.Parser Cloud API предоставляет несколько способов извлечения изображений из документов. Вы можете извлечь все изображения из всего документа, извлечь изображения из определенных страниц, установив диапазон страниц. В следующем примере показано, как извлечь изображения из документа внутри контейнера.

Извлечение изображений из портфолио PDF — Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

JPEGXLTMGIFPPTDOCPPTXODSFB2MSGDOTXOTSPOTMXHTMLDOCMONEXLAMZIPHTMLTXTOTPXLSBBZ2DOTMEPUBPPSPPTMPSTMDPDFXLSMOTTPPSMOSTTIFFRTFXLSTARPOTPPSXJPGCSVTIFCHMMHTMLRARDOTXLTXODPXLTEMLXPOTXJP2DOCXPNGODTEMLBMPXLSXXMLXLAGZ

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

PPTXXLSXPOTXXLSMJPGPPSPPTMTIFFZIPGZMSGDOCMODTDOCXEPUBDOCPPTMDOTTPOTMEMLXDOTMRARXLTMPDFDOTXEMLXLSBHTMLJP2PNGODSXMLGIFXLSXLTXBZ2TIFXLAMRTFODPCSVOTPJPEGTARXLADOTPPSXPPSMCHMOSTPSTONEFB2BMPMHTMLXLTXHTMLPOTOTSTXT

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ