Extraiga texto, imágenes, metadatos y otros datos de más de 40 formatos de documentos. Aplicar plantilla para extraer tablas o campos de datos específicos.
Empiza la prueba gratuitaGroupDocs.Parser Cloud para Node.js es un contenedor alrededor de la API REST de extracción de datos de documentos para analizar más de 50 tipos de documentos. Extraer texto en varios modos, extraer imágenes, analizar documentos con plantillas predefinidas son las características más populares de GroupDocs.Parser Cloud API. La API admite archivos y contenedores protegidos con contraseña, como archivos ZIP, archivos de datos de correo OST/PST, libros electrónicos, marcas y carteras PDF en sus aplicaciones Node.js.
Analizar PDF, documentos de procesamiento de texto, hojas de cálculo y presentaciones
Analice archivos de plantilla de Microsoft Word, Excel, PowerPoint y OpenDocument
Analizar documentos y plantillas habilitados para macros para MS Word, Excel y PowerPoint
Extraer contenido de texto de todo el documento
Extraer texto e imágenes de páginas específicas
Extraiga texto formateado configurando el modo de extracción
Extraiga texto de los documentos en archivos ZIP o correos electrónicos
Recupere documentos de correos electrónicos, carpetas en PDF y almacenamientos de MS Outlook
Obtenga el recuento de páginas del documento y otra información
GroupDocs.Parser Cloud API proporciona varias formas de extraer texto de los documentos. El siguiente ejemplo muestra cómo extraer texto formateado de un documento.
// For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node-samples
global.parser_cloud = require("groupdocs-parser-cloud");
global.appSid = "XXXX-XXXX-XXXX-XXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.appKey = "XXXXXXXXXXXXXXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.parseApi = parser_cloud.ParseApi.fromKeys(appSid, appKey);
let fileInfo = new parser_cloud.FileInfo();
fileInfo.filePath = "words-processing/docx/formatted-document.docx";
let options = new parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "Markdown";
options.formattedTextOptions = formattedTextOptions;
let request = new parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
```