Parsen und Extrahieren mit REST API und Java SDK

Analysieren Sie Dokumente wie Rechnungen, Quittungen oder Finanztabellen, um Text, Bilder und Metadaten aus über 40 gängigen Dokumentformaten zu extrahieren.

Kostenlos testen

GroupDocs.Parser Cloud für Java ist ein Wrapper um die REST-API für die Extraktion von Dokumentdaten, um über 50 Dokumenttypen zu parsen. Das Parsen von Dokumenten mit vordefinierten Vorlagen ist eine der wertvollsten Funktionen der GroupDocs.Parser Cloud API. Es ist sehr einfach, Vorlagen zu definieren und Daten aus Rechnungen oder anderen typischen Dokumenten zu extrahieren. Die API bietet Methoden zum Extrahieren von Bildern, Text und Metadaten aus fast allen gängigen Dateiformaten. Neben den regulären Dokumenten können Sie die unterstützten Funktionen für passwortgeschützte Dateien und Container wie ZIP-Archive, OST/PST-Maildatendateien, eBooks, Markups und PDF-Portfolios in Ihren Java-Anwendungen verwenden.

Document Parser REST-API-Funktionen

Analysieren Sie PDF-Dateien, Textverarbeitungsdokumente, Tabellenkalkulationen und Präsentationen

Analysieren Sie Microsoft Word-, Excel-, PowerPoint- und OpenDocument-Vorlagendateien

Analysieren Sie makrofähige Dokumente und Vorlagen für MS Word, Excel und PowerPoint

Extrahieren Sie Textinhalte aus dem gesamten Dokument

Extrahieren Sie Text und Bilder von bestimmten Seiten

Extrahieren Sie formatierten Text, indem Sie den Extraktionsmodus festlegen

Extrahieren Sie Text aus den Dokumenten in ZIP-Archiven oder E-Mails

Rufen Sie Dokumente aus E-Mails, PDF-Portfolios und MS Outlook-Speichern ab

Rufen Sie die Seitenzahl des Dokuments und andere Informationen ab

Bilder aus einem Dokument extrahieren

Die GroupDocs.Parser Cloud API bietet mehrere Möglichkeiten, Bilder aus den Dokumenten zu extrahieren. Sie können alle Bilder aus dem gesamten Dokument extrahieren, Bilder aus bestimmten Seiten extrahieren, indem Sie den Seitenbereich festlegen. Das folgende Beispiel zeigt, wie Sie Bilder aus einem Dokument in einem Container extrahieren.

Extrahieren Sie Bilder aus einem PDF-Portfolio - Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Support und Lernressourcen

GroupDocs.Parser Cloud bietet auch einzelne Dokumentparsing-SDKs für andere Sprachen, wie unten aufgeführt:

  Deutsch