Analizar y extraer con REST API y Java SDK

Analice documentos como facturas, recibos o tablas financieras para extraer texto, imágenes y metadatos de más de 40 formatos de documentos populares.

Empiza la prueba gratuita

GroupDocs.Parser Cloud para Java es un contenedor de API REST de extracción de datos de documentos para analizar más de 50 tipos de documentos. El análisis de documentos con plantillas predefinidas es una de las características más valiosas de GroupDocs.Parser Cloud API. Es muy simple y fácil definir plantillas y extraer datos de facturas u otros tipos de documentos típicos. La API proporciona métodos para extraer imágenes, extraer texto y metadatos de casi todos los formatos de archivo más comunes. Junto con los documentos normales, puede usar las funciones admitidas en archivos y contenedores protegidos con contraseña, como archivos ZIP, archivos de datos de correo OST/PST, libros electrónicos, anotaciones y carteras PDF en sus aplicaciones Java.

Características de la API REST del analizador de documentos

Analizar PDF, documentos de procesamiento de texto, hojas de cálculo y presentaciones

Analice archivos de plantilla de Microsoft Word, Excel, PowerPoint y OpenDocument

Analizar documentos y plantillas habilitados para macros para MS Word, Excel y PowerPoint

Extraer contenido de texto de todo el documento

Extraer texto e imágenes de páginas específicas

Extraiga texto formateado configurando el modo de extracción

Extraiga texto de los documentos en archivos ZIP o correos electrónicos

Recupere documentos de correos electrónicos, carpetas en PDF y almacenamientos de MS Outlook

Obtenga el recuento de páginas del documento y otra información

Extraer imágenes de un documento

GroupDocs.Parser Cloud API proporciona varias formas de extraer imágenes de los documentos. Puede extraer todas las imágenes de todo el documento, extraer imágenes de páginas específicas configurando el rango de páginas. El siguiente ejemplo muestra cómo extraer imágenes de un documento dentro de un contenedor.

Extraer imágenes de una cartera PDF - Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Recursos de apoyo y aprendizaje

GroupDocs.Parser Cloud también ofrece SDK de análisis de documentos individuales para otros idiomas, como se indica a continuación:

  Español