Analyser et extraire avec l'API REST et le SDK Java

Analysez des documents tels que des factures, des reçus ou des tableaux financiers pour extraire du texte, des images et des métadonnées de plus de 40 formats de documents populaires.

Commencer l'essai gratuit

GroupDocs.Parser Cloud pour Java est un wrapper autour de l’API REST d’extraction de données de document pour analyser plus de 50 types de documents. L’analyse de documents avec des modèles prédéfinis est l’une des fonctionnalités les plus précieuses de l’API GroupDocs.Parser Cloud. Il est très simple et facile de définir des modèles et d’extraire des données de factures ou d’autres types de documents typiques. L’API fournit des méthodes pour extraire des images, extraire du texte et des métadonnées de presque tous les formats de fichiers les plus courants. En plus des documents standard, vous pouvez utiliser les fonctionnalités prises en charge sur les fichiers et conteneurs protégés par mot de passe tels que les archives ZIP, les fichiers de données de messagerie OST/PST, les livres électroniques, les annotations et les portefeuilles PDF dans vos applications Java.

Fonctionnalités de l’API REST de l’analyseur de documents

Analyser des PDF, des documents de traitement de texte, des feuilles de calcul et des présentations

Analyser les fichiers modèles Microsoft Word, Excel, PowerPoint et OpenDocument

Parse Macro-Enabled document & templates pour MS Word, Excel et PowerPoint

Extraire le contenu textuel de l’ensemble du document

Extraire du texte et des images de pages spécifiques

Extraire le texte formaté en définissant le mode d’extraction

Extraire le texte des documents dans les archives ZIP ou les e-mails

Récupérez des documents à partir d’e-mails, de portefeuilles PDF et de stockages MS Outlook

Obtenir le nombre de pages du document et d’autres informations

Extraire des images d’un document

GroupDocs.Parser Cloud API, fournit plusieurs façons d’extraire des images des documents. Vous pouvez extraire toutes les images de l’ensemble du document, extraire des images de pages spécifiques en définissant la plage de pages. L’exemple suivant montre comment extraire des images d’un document à l’intérieur d’un conteneur.

Extraire des images d’un portfolio PDF - Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Ressources d'assistance et d'apprentissage

GroupDocs.Parser Cloud propose également des SDK d’analyse de documents individuels pour d’autres langues, comme indiqué ci-dessous :

  Français