Обработка документов стала проще благодаря этому анализу документов REST API и Python SDK.

Извлекайте данные из более чем 40 популярных форматов документов. Анализ документов с использованием шаблона в пакетном режиме.

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
Начать бесплатную пробную версию

GroupDocs.Parser Cloud для Python позволяет анализировать данные из более чем 50 популярных типов документов. Извлечение текста, извлечение изображений, анализ данных по шаблону — наиболее ценные функции GroupDocs.Parser, доступные в нашем сервисе Cloud REST API. С помощью нашего SDK можно решать многие задачи автоматизации обработки документов и легко извлекать данные, просто применяя предопределенный шаблон. Наряду с обычными документами вы можете использовать поддерживаемые функции для защищенных паролем файлов и контейнеров, таких как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, разметки и портфолио PDF в своих приложениях Python.

Часто задаваемые вопросы

Я хочу создать собственное приложение Python, которое может анализировать файлы онлайн?

Проверьте наши Cloud SDK для Python на GitHub, если вы ищете исходный код для анализа файлов в облаке.

Могу ли я бесплатно попробовать REST API GroupDocs.Parser на Python?

Вы можете попробовать GroupDocs.Parser API Python с низким кодом без каких-либо ограничений.

Я не хочу никуда загружать свои конфиденциальные файлы? Каковы мои варианты?

GroupDocs.Parser Cloud также доступен в виде образа Docker, который можно использовать для [самостоятельного размещения] (https://purchase.groupdocs.cloud/self-hosting) сервиса. Или вы можете создавать свои собственные службы, используя GroupDocs.Parser High-code API, которые в настоящее время управляют как нашими бесплатными приложениями, так и REST API.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечение данных из документа с применением шаблона

GroupDocs.Parser Cloud API, позволяет извлекать данные из документов по шаблону. Вы можете определить шаблон для ваших типичных документов, таких как счета, квитанции, отчеты, и применяя шаблон, вы можете легко извлекать данные для дальнейшей обработки. В следующем примере показано, как извлечь данные по шаблону.

Извлечение данных из документов по шаблону — Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

JP2OTSEMLXXLSPOTDOCMTXTEPUBPNGJPGDOTMDOCXZIPMHTMLXLTDOCOSTODPPOTMXLADOTXXLAMHTMLONEOTPXLTMXHTMLFB2PDFGZOTTODSPPSMDGIFBZ2TIFFPPTXPSTTIFXLSMMSGPPTPPSMXMLPPSXXLSBRARPOTXJPEGPPTMCSVDOTXLTXBMPXLSXEMLCHMODTTARRTF

Извлечение изображений из документов с помощью бесплатного приложения GroupDocs.Parser

XLSJPEGHTMLPPTXPDFXHTMLONEDOCMPPTMXLTMXLSBXLTTARPOTXPPSDOTXOTPMDTIFFPOTMDOTMPSTPPTXLSMZIPCSVXLAMPOTDOCXOTTPPSMBZ2JPGMSGTXTFB2EPUBRARXLTXBMPXMLDOCODTGIFJP2EMLMHTMLPNGDOTPPSXEMLXODSOTSODPXLATIFGZRTFOSTCHMXLSX

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ