GroupDocs.Parser Cloud for Node.js 是文档数据提取 REST API 的包装器,用于解析 50 多种文档类型。以各种模式提取文本、提取图像、使用预定义模板解析文档是 GroupDocs.Parser Cloud API 最流行的功能。 该 API 支持您的 Node.js 应用程序中受密码保护的文件和容器,例如 ZIP 存档、OST/PST 邮件数据文件、电子书、标记和 PDF 组合。
解析 PDF、文字处理文档、电子表格和演示文稿
解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件
为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板
从整个文档中提取文本内容
从特定页面中提取文本和图像
通过设置提取模式提取格式化文本
从 ZIP 档案或电子邮件中的文档中提取文本
从电子邮件、PDF 组合和 MS Outlook 存储中检索文档
获取文档页数和其他信息
GroupDocs.Parser Cloud API,提供了几种从文档中提取文本的方法。以下示例显示了如何从文档中提取格式化文本。
// For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node-samples
global.parser_cloud = require("groupdocs-parser-cloud");
global.appSid = "XXXX-XXXX-XXXX-XXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.appKey = "XXXXXXXXXXXXXXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.parseApi = parser_cloud.ParseApi.fromKeys(appSid, appKey);
let fileInfo = new parser_cloud.FileInfo();
fileInfo.filePath = "words-processing/docx/formatted-document.docx";
let options = new parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "Markdown";
options.formattedTextOptions = formattedTextOptions;
let request = new parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
```