Анализ документов и извлечение данных с помощью cURL

Анализируйте PDF и форматы файлов из Word, Excel, Интернета, электронных книг, электронных писем, ZIP-архивов для извлечения текста, изображений и метаданных с помощью REST API.

Начать бесплатную пробную версию

GroupDocs.Parser Cloud for cURL позволяет анализировать и извлекать данные почти для всех распространенных форматов деловых документов. Использование простых команд cURL; текст и изображения могут быть извлечены из всего документа или из определенного диапазона страниц. REST API также поддерживает архивы, такие как ZIP, для анализа и извлечения изображений, информации о документе и сведений об элементах контейнера.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа

Используя GroupDocs.Parser Cloud API, вы можете быстро извлекать изображения, текст и метаданные из документа, размещенного в вашем облачном хранилище. Следующая простая команда cURL показывает, как извлечь текст из документа.

Разобрать документ MS Word для извлечения текста — cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ