Извлекайте текст, изображения, метаданные и другие данные из более чем 40 форматов документов. Примените шаблон для извлечения таблиц или определенных полей данных.
Начать бесплатную пробную версиюGroupDocs.Parser Cloud для Node.js — это оболочка REST API для извлечения данных из документов для анализа более 50 типов документов. Извлечение текста в различных режимах, извлечение изображений, парсинг документов по предустановленным шаблонам — самые популярные функции GroupDocs.Parser Cloud API. API поддерживает защищенные паролем файлы и контейнеры, такие как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, разметки и портфолио PDF в ваших приложениях Node.js.
Разбор PDF, текстовых документов, электронных таблиц и презентаций
Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument
Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint
Извлечение текстового содержимого из всего документа
Извлечение текста и изображений с определенных страниц
Извлечь форматированный текст, установив режим извлечения
Извлечение текста из документов в ZIP-архивах или электронных письмах
Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook
Получить количество страниц документа и другую информацию
GroupDocs.Parser Cloud API предоставляет несколько способов извлечения текста из документов. В следующем примере показано, как извлечь форматированный текст из документа.
// For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node-samples
global.parser_cloud = require("groupdocs-parser-cloud");
global.appSid = "XXXX-XXXX-XXXX-XXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.appKey = "XXXXXXXXXXXXXXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.parseApi = parser_cloud.ParseApi.fromKeys(appSid, appKey);
let fileInfo = new parser_cloud.FileInfo();
fileInfo.filePath = "words-processing/docx/formatted-document.docx";
let options = new parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "Markdown";
options.formattedTextOptions = formattedTextOptions;
let request = new parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
```