Анализ документов и извлечение данных с помощью cURL

Анализируйте PDF и форматы файлов из Word, Excel, Интернета, электронных книг, электронных писем, ZIP-архивов для извлечения текста, изображений и метаданных с помощью REST API.

  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Начать бесплатную пробную версию

GroupDocs.Parser Cloud for cURL позволяет анализировать и извлекать данные почти для всех распространенных форматов деловых документов. Использование простых команд cURL; текст и изображения могут быть извлечены из всего документа или из определенного диапазона страниц. REST API также поддерживает архивы, такие как ZIP, для анализа и извлечения изображений, информации о документе и сведений об элементах контейнера.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа

Используя GroupDocs.Parser Cloud API, вы можете быстро извлекать изображения, текст и метаданные из документа, размещенного в вашем облачном хранилище. Следующая простая команда cURL показывает, как извлечь текст из документа.

Разобрать документ MS Word для извлечения текста — cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

XLTPOTMDOTXLSTXTJPGDOCMXLTXCHMZIPJP2BMPHTMLODTODPTARXMLPPSXCSVPPTXXLSBEMLXTIFFONEXLSXODSOTSMHTMLEPUBMDXLSMDOCPPTMFB2OSTPDFEMLPOTXBZ2XLTMPPSMDOTXPPSTIFMSGGIFPNGDOCXXHTMLGZJPEGOTPPOTXLAXLAMRARPPTOTTPSTRTFDOTM

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

DOCRTFMDXLAMTIFRARPDFHTMLPOTMHTMLXLTXODPXLSBXMLZIPPPTXPSTDOTMODSEMLOTPXLTOTTGZDOCMMSGXLADOTGIFJPEGTARDOCXDOTXCHMXLTMONEPNGPPSMPPTMEPUBBMPXLSEMLXJP2PPSOTSFB2TXTXHTMLOSTJPGPPTODTPOTMXLSXPPSXPOTXCSVXLSMBZ2TIFF

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ