Analysez des documents tels que des factures, des reçus ou des tableaux financiers pour extraire du texte, des images et des métadonnées de plus de 40 formats de documents populaires.
Commencer l'essai gratuitGroupDocs.Parser Cloud pour Java est un wrapper autour de l’API REST d’extraction de données de document pour analyser plus de 50 types de documents. L’analyse de documents avec des modèles prédéfinis est l’une des fonctionnalités les plus précieuses de l’API GroupDocs.Parser Cloud. Il est très simple et facile de définir des modèles et d’extraire des données de factures ou d’autres types de documents typiques. L’API fournit des méthodes pour extraire des images, extraire du texte et des métadonnées de presque tous les formats de fichiers les plus courants. En plus des documents standard, vous pouvez utiliser les fonctionnalités prises en charge sur les fichiers et conteneurs protégés par mot de passe tels que les archives ZIP, les fichiers de données de messagerie OST/PST, les livres électroniques, les annotations et les portefeuilles PDF dans vos applications Java.
Analyser des PDF, des documents de traitement de texte, des feuilles de calcul et des présentations
Analyser les fichiers modèles Microsoft Word, Excel, PowerPoint et OpenDocument
Parse Macro-Enabled document & templates pour MS Word, Excel et PowerPoint
Extraire le contenu textuel de l’ensemble du document
Extraire du texte et des images de pages spécifiques
Extraire le texte formaté en définissant le mode d’extraction
Extraire le texte des documents dans les archives ZIP ou les e-mails
Récupérez des documents à partir d’e-mails, de portefeuilles PDF et de stockages MS Outlook
Obtenir le nombre de pages du document et d’autres informations
GroupDocs.Parser Cloud API, fournit plusieurs façons d’extraire des images des documents. Vous pouvez extraire toutes les images de l’ensemble du document, extraire des images de pages spécifiques en définissant la plage de pages. L’exemple suivant montre comment extraire des images d’un document à l’intérieur d’un conteneur.
// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples