借助此文档解析 REST API 和 Python SDK,文档处理变得轻松

从 40 多种流行的文档格式中提取数据。在批处理中应用模板解析文档。

开始免费试用

GroupDocs.Parser Cloud for Python 允许解析来自 50 多种流行文档类型的数据。文本提取、图像提取、按模板解析数据是 GroupDocs.Parser 最有价值的功能,可在我们的 Cloud REST API 服务中使用。使用我们的 SDK,只需应用预定义的模板,就可以解决许多文档处理自动化任务并轻松提取数据。 除了常规文档,您还可以在 Python 应用程序中使用受密码保护的文件和容器(如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合)的支持功能。

文档解析器 REST API 功能

解析 PDF、文字处理文档、电子表格和演示文稿

解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件

为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板

从整个文档中提取文本内容

从特定页面中提取文本和图像

通过设置提取模式提取格式化文本

从 ZIP 档案或电子邮件中的文档中提取文本

从电子邮件、PDF 组合和 MS Outlook 存储中检索文档

获取文档页数和其他信息

应用模板从文档中提取数据

GroupDocs.Parser Cloud API,允许通过模板从文档中提取数据。您可以为发票、收据、报告等典型文档定义模板,并应用模板轻松提取数据以进行进一步处理。以下示例显示了如何通过模板提取数据。

通过模板从文档中提取数据 - Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

支持和学习资源

GroupDocs.Parser Cloud 还为其他语言提供单独的文档解析 SDK,如下所示:

  中文