Анализ документов и извлечение данных с помощью cURL

Анализируйте PDF и форматы файлов из Word, Excel, Интернета, электронных книг, электронных писем, ZIP-архивов для извлечения текста, изображений и метаданных с помощью REST API.

Начать бесплатную пробную версию

GroupDocs.Parser Cloud for cURL позволяет анализировать и извлекать данные почти для всех распространенных форматов деловых документов. Использование простых команд cURL; текст и изображения могут быть извлечены из всего документа или из определенного диапазона страниц. REST API также поддерживает архивы, такие как ZIP, для анализа и извлечения изображений, информации о документе и сведений об элементах контейнера.

В
Взглянуть мельком
Поддерживается
Форматы файлов
Платформа
Независимость

Обзор функций, поддерживаемых облачным API парсера документов.‎

Функции

Разбирать документы
Разобрать документ по шаблону
Извлечь текст
Извлечение изображений
Извлечь метаданные

Выдержка из документов

Электронная почта
электронные книги
PDF-файлы
PDF-портфолио
Файлы в ZIP-архивах
Текст и разметка документов
Microsoft и OpenDocument

GroupDocs.Parser

Облачный API парсера документов поддерживает форматы.

Форматы Microsoft Office

Обработка текстов: DOC, DOCX, DOCM, DOT, DOTX, DOTM
Электронные таблицы: XLS, XLSX, XLSM, XLSB, XLT, XLTX, XLTM, XLA, XLAM
Презентации: PPT, PPTX, PPTM, PPS, PPSX, PPSM, POT, POTX, POTM
OneNote: ОДИН

OpenDocument и другие форматы

Форматы OpenDocument: ODT, OTT, ODS, OTS, ODP, OTP
Текст: TXT, RTF
Разметка: HTML, XHTML, MHTML, MD, XML
Портативные форматы: PDF
Электронная почта: PST, OST, EML, EMLX, MSG
Форматы электронных книг: EPUB, FB2, CHM
Другое: НОМЕРА, CSV, ZIP

GroupDocs.Parser

Поддерживаемые операционные системы и платформы

Независимость от облачной платформы GroupDocs

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа

Используя GroupDocs.Parser Cloud API, вы можете быстро извлекать изображения, текст и метаданные из документа, размещенного в вашем облачном хранилище. Следующая простая команда cURL показывает, как извлечь текст из документа.

Разобрать документ MS Word для извлечения текста — cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

Анализ документов и извлечение данных с помощью cURL

GroupDocs.Parser
Cloud для cURL

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа

Разобрать документ MS Word для извлечения текста — cURL

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

Ресурсы поддержки и обучения

Образовательные ресурсы

Поддержка продукта

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

GroupDocs.Parser
Cloud SDK для .NET

GroupDocs.Parser
Cloud SDK для Java

GroupDocs.Parser
Cloud SDK для PHP

GroupDocs.Parser
Cloud SDK для Python

GroupDocs.Parser
Cloud SDK для Ruby

GroupDocs.Parser
Cloud SDK для Node.js

Анализ документов и извлечение данных с помощью cURL

GroupDocs.ParserCloud для cURL

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа

Разобрать документ MS Word для извлечения текста — cURL

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

Ресурсы поддержки и обучения

Образовательные ресурсы

Поддержка продукта

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

GroupDocs.ParserCloud SDK для .NET

GroupDocs.ParserCloud SDK для Java

GroupDocs.ParserCloud SDK для PHP

GroupDocs.ParserCloud SDK для Python

GroupDocs.ParserCloud SDK для Ruby

GroupDocs.ParserCloud SDK для Node.js

GroupDocs.Parser
Cloud для cURL

GroupDocs.Parser
Cloud SDK для .NET

GroupDocs.Parser
Cloud SDK для Java

GroupDocs.Parser
Cloud SDK для PHP

GroupDocs.Parser
Cloud SDK для Python

GroupDocs.Parser
Cloud SDK для Ruby

GroupDocs.Parser
Cloud SDK для Node.js