Extraiga datos de más de 40 formatos de documentos populares. Analizar documentos aplicando una plantilla en un proceso por lotes.
Empiza la prueba gratuitaGroupDocs.Parser Cloud for Python permite analizar datos de más de 50 tipos de documentos populares. La extracción de texto, la extracción de imágenes y el análisis de datos por plantilla son las características más valiosas de GroupDocs.Parser y están disponibles en nuestro servicio API REST en la nube. Con nuestro SDK es posible resolver muchas tareas de automatización de procesamiento de documentos y extraer datos fácilmente simplemente aplicando una plantilla predefinida. Junto con los documentos normales, puede usar las funciones admitidas en archivos y contenedores protegidos con contraseña, como archivos ZIP, archivos de datos de correo OST/PST, libros electrónicos, marcas y carteras PDF en sus aplicaciones de Python.
Analizar PDF, documentos de procesamiento de texto, hojas de cálculo y presentaciones
Analice archivos de plantilla de Microsoft Word, Excel, PowerPoint y OpenDocument
Analizar documentos y plantillas habilitados para macros para MS Word, Excel y PowerPoint
Extraer contenido de texto de todo el documento
Extraer texto e imágenes de páginas específicas
Extraiga texto formateado configurando el modo de extracción
Extraiga texto de los documentos en archivos ZIP o correos electrónicos
Recupere documentos de correos electrónicos, carpetas en PDF y almacenamientos de MS Outlook
Obtenga el recuento de páginas del documento y otra información
GroupDocs.Parser Cloud API, permite extraer datos de documentos mediante una plantilla. Puede definir una plantilla para sus documentos típicos, como facturas, recibos, informes y, al aplicar la plantilla, puede extraer fácilmente datos para su posterior procesamiento. El siguiente ejemplo muestra cómo extraer datos por plantilla.
# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud
app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)
options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"
request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
```