Обработка документов стала проще благодаря этому анализу документов REST API и Python SDK.

Извлекайте данные из более чем 40 популярных форматов документов. Анализ документов с использованием шаблона в пакетном режиме.

Начать бесплатную пробную версию

GroupDocs.Parser Cloud для Python позволяет анализировать данные из более чем 50 популярных типов документов. Извлечение текста, извлечение изображений, анализ данных по шаблону — наиболее ценные функции GroupDocs.Parser, доступные в нашем сервисе Cloud REST API. С помощью нашего SDK можно решать многие задачи автоматизации обработки документов и легко извлекать данные, просто применяя предопределенный шаблон. Наряду с обычными документами вы можете использовать поддерживаемые функции для защищенных паролем файлов и контейнеров, таких как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, разметки и портфолио PDF в своих приложениях Python.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечение данных из документа с применением шаблона

GroupDocs.Parser Cloud API, позволяет извлекать данные из документов по шаблону. Вы можете определить шаблон для ваших типичных документов, таких как счета, квитанции, отчеты, и применяя шаблон, вы можете легко извлекать данные для дальнейшей обработки. В следующем примере показано, как извлечь данные по шаблону.

Извлечение данных из документов по шаблону — Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ