使用此 REST API 和 Node.js Cloud SDK 从您的文档中提取数据

从 40 多种文档格式中提取文本、图像、元数据和其他数据。应用模板提取表格或特定数据字段。

开始免费试用

GroupDocs.Parser Cloud for Node.js 是文档数据提取 REST API 的包装器,用于解析 50 多种文档类型。以各种模式提取文本、提取图像、使用预定义模板解析文档是 GroupDocs.Parser Cloud API 最流行的功能。 该 API 支持您的 Node.js 应用程序中受密码保护的文件和容器,例如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合。

文档解析器 REST API 功能

解析 PDF、文字处理文档、电子表格和演示文稿

解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件

为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板

从整个文档中提取文本内容

从特定页面中提取文本和图像

通过设置提取模式提取格式化文本

从 ZIP 档案或电子邮件中的文档中提取文本

从电子邮件、PDF 组合和 MS Outlook 存储中检索文档

获取文档页数和其他信息

从文档中提取格式化文本

GroupDocs.Parser Cloud API,提供了几种从文档中提取文本的方法。以下示例显示了如何从文档中提取格式化文本。

从文档中提取格式化文本 - Node.js

// For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node-samples
global.parser_cloud = require("groupdocs-parser-cloud");

global.appSid = "XXXX-XXXX-XXXX-XXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.appKey = "XXXXXXXXXXXXXXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud

global.parseApi = parser_cloud.ParseApi.fromKeys(appSid, appKey);

let fileInfo = new parser_cloud.FileInfo();
fileInfo.filePath = "words-processing/docx/formatted-document.docx";

let options = new parser_cloud.TextOptions();
options.fileInfo = fileInfo;

let formattedTextOptions = new parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "Markdown";
options.formattedTextOptions = formattedTextOptions;

let request = new parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
    ```

支持和学习资源

GroupDocs.Parser Cloud 还为其他语言提供单独的文档解析 SDK,如下所示:

  中文