GroupDocs.Parser Cloud for Python 允许解析来自 50 多种流行文档类型的数据。文本提取、图像提取、按模板解析数据是 GroupDocs.Parser 最有价值的功能,可在我们的 Cloud REST API 服务中使用。使用我们的 SDK,只需应用预定义的模板,就可以解决许多文档处理自动化任务并轻松提取数据。 除了常规文档,您还可以在 Python 应用程序中使用受密码保护的文件和容器(如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合)的支持功能。
如果您正在寻找源代码来解析云中的文件,请在 GitHub 查看我们的 Python 云 SDK。
您可以试用 GroupDocs.Parser 低代码 Python API,没有任何限制。
GroupDocs.Parser Cloud 也可用作 Docker 映像,可用于 自托管 服务。或者,您可以使用 GroupDocs.Parser 高代码 API 构建您自己的服务,这些 API 目前驱动着我们的免费应用程序和 REST API。
GroupDocs.Parser Cloud API,允许通过模板从文档中提取数据。您可以为发票、收据、报告等典型文档定义模板,并应用模板轻松提取数据以进行进一步处理。以下示例显示了如何通过模板提取数据。
# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud
app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)
options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"
request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
```