使用 cURL 解析文档和提取数据

从 Word、Excel、Web、电子书、电子邮件、ZIP 档案中解析 PDF 和文件格式,以使用 REST API 提取文本、图像和元数据。

  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
开始免费试用

GroupDocs.Parser Cloud for cURL 允许对几乎所有常见的业务文档格式进行解析和数据提取。使用简单的 cURL 命令;文本和图像可以从整个文档或特定页面范围中提取。 REST API 还支持对 ZIP 等档案进行解析和提取图像、文档信息和容器项目的详细信息。

文档解析器 REST API 功能

解析 PDF、文字处理文档、电子表格和演示文稿

解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件

为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板

从整个文档中提取文本内容

从特定页面中提取文本和图像

通过设置提取模式提取格式化文本

从 ZIP 档案或电子邮件中的文档中提取文本

从电子邮件、PDF 组合和 MS Outlook 存储中检索文档

获取文档页数和其他信息

从文档中提取文本

使用 GroupDocs.Parser Cloud API,您可以从放置在云存储中的文档中快速提取图像、文本和元数据。以下简单的 cURL 命令显示了如何从文档中提取文本。

解析 MS Word 文档以提取文本 - cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

使用 GroupDocs.Parser 免费应用程序从文档中提取图像

TIFOTPDOCMBZ2PPSMMHTMLDOCXZIPDOCDOTMMSGEMLPPSPSTPPTGIFTXTXLAXMLPOTMPPTMPDFTARDOTXXLAMEPUBHTMLFB2POTODTODSTIFFMDXLTXONEXLTRTFXLSBEMLXCSVOTSRARPPSXXLSMJP2JPGXLSXXLTMOSTGZJPEGXLSXHTMLPPTXBMPOTTODPPOTXPNGDOTCHM

使用 GroupDocs.Parser 免费应用程序从文档中提取图像

DOCXXLARARJPGXLAMPNGDOTXPPTXGZONEPDFPOTCHMEPUBBMPJPEGZIPDOTEMLMSGDOTMTXTPPSXLSMOTSXLSXXHTMLXLSBGIFOSTODTTIFXMLMDJP2PPTMRTFDOCMDOCOTTXLTXPOTXODPXLTMPOTMEMLXBZ2OTPPSTPPTTIFFCSVODSPPSXMHTMLFB2HTMLPPSMTARXLSXLT

支持和学习资源

GroupDocs.Parser Cloud 还为其他语言提供单独的文档解析 SDK,如下所示:

  中文