借助此文档解析 REST API 和 Python SDK,文档处理变得轻松

从 40 多种流行的文档格式中提取数据。在批处理中应用模板解析文档。

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
开始免费试用

GroupDocs.Parser Cloud for Python 允许解析来自 50 多种流行文档类型的数据。文本提取、图像提取、按模板解析数据是 GroupDocs.Parser 最有价值的功能,可在我们的 Cloud REST API 服务中使用。使用我们的 SDK,只需应用预定义的模板,就可以解决许多文档处理自动化任务并轻松提取数据。 除了常规文档,您还可以在 Python 应用程序中使用受密码保护的文件和容器(如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合)的支持功能。

经常问的问题

我想创建自己的可以在线解析文件的 Python 应用程序?

如果您正在寻找源代码来解析云中的文件,请在 GitHub 查看我们的 Python 云 SDK。

我可以在 Python 上免费试用 GroupDocs.Parser REST API 吗?

您可以试用 GroupDocs.Parser 低代码 Python API,没有任何限制。

我不想在任何地方上传我的机密文件?我有哪些选择?

GroupDocs.Parser Cloud 也可用作 Docker 映像,可用于 自托管 服务。或者,您可以使用 GroupDocs.Parser 高代码 API 构建您自己的服务,这些 API 目前驱动着我们的免费应用程序和 REST API。

文档解析器 REST API 功能

解析 PDF、文字处理文档、电子表格和演示文稿

解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件

为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板

从整个文档中提取文本内容

从特定页面中提取文本和图像

通过设置提取模式提取格式化文本

从 ZIP 档案或电子邮件中的文档中提取文本

从电子邮件、PDF 组合和 MS Outlook 存储中检索文档

获取文档页数和其他信息

应用模板从文档中提取数据

GroupDocs.Parser Cloud API,允许通过模板从文档中提取数据。您可以为发票、收据、报告等典型文档定义模板,并应用模板轻松提取数据以进行进一步处理。以下示例显示了如何通过模板提取数据。

通过模板从文档中提取数据 - Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

使用 GroupDocs.Parser 免费应用程序从文档中提取图像

PPTXOTPOTSDOTXLTXJPEGPPTMPPSXRTFXLAPOTTIFFEPUBZIPXLSBODSXLTMPPSMXHTMLPOTMBMPPNGPPTXLSONETIFEMLXXMLODPPPSPOTXMHTMLMSGMDJP2RARDOTXODTGIFPSTCSVXLSMPDFTAROSTDOTMDOCMJPGBZ2DOCCHMDOCXFB2TXTOTTXLTGZXLSXXLAMEMLHTML

使用 GroupDocs.Parser 免费应用程序从文档中提取图像

DOCOTTOTPMSGZIPPPSTXTXLSPSTPNGXLTMMHTMLODTOTSPOTXLSMDOCMPDFJPEGHTMLFB2EMLJP2PPSXXLTOSTXLSXDOTGZJPGPPSMXLAMTIFFBMPXLARTFEPUBXLSBDOTMXHTMLMDRARPPTXTIFCSVXMLPPTMONEXLTXPOTXBZ2ODSDOCXGIFCHMEMLXPOTMDOTXODPPPTTAR

支持和学习资源

GroupDocs.Parser Cloud 还为其他语言提供单独的文档解析 SDK,如下所示:

  中文