REST API 및 Java SDK를 사용한 구문 분석 및 추출

송장, 영수증, 금융표 등의 문서를 구문 분석하여 40개 이상의 널리 사용되는 문서 형식에서 텍스트, 이미지, 메타데이터를 추출합니다.

  • GroupDocs.Parser Cloud for cURL
  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
무료 평가판 시작

GroupDocs.Parser Cloud for Java는 50개 이상의 문서 유형을 구문 분석하기 위한 문서 데이터 추출 REST API에 대한 래퍼입니다. 사전 정의된 템플릿으로 문서를 구문 분석하는 것은 GroupDocs.Parser Cloud API의 가장 중요한 기능 중 하나입니다. 템플릿을 정의하고 송장이나 기타 일반적인 문서에서 데이터를 추출하는 것은 매우 간단하고 쉽습니다. API는 거의 모든 가장 일반적인 파일 형식에서 이미지를 추출하고 텍스트와 메타데이터를 추출하는 방법을 제공합니다. 일반 문서와 함께 Java 애플리케이션의 ZIP 아카이브, OST/PST 메일 데이터 파일, eBook, 마크업 및 PDF 포트폴리오와 같은 비밀번호로 보호된 파일 및 컨테이너에서 지원되는 기능을 사용할 수 있습니다.

자주 묻는 질문

온라인으로 파일을 구문 분석할 수 있는 나만의 Java 애플리케이션을 만들고 싶습니까?

클라우드에서 파일을 파싱하기 위한 소스 코드를 찾고 있다면 GitHub에서 Java용 Cloud SDK를 확인하세요.

Java에서 GroupDocs.Parser REST API를 무료로 사용해 볼 수 있나요?

아무런 제한 없이 GroupDocs.Parser 로우 코드 Java API를 사용해 볼 수 있습니다.

내 기밀 파일을 어디에도 업로드하고 싶지 않습니까? 내 옵션은 무엇입니까?

GroupDocs.Parser Cloud는 서비스를 자체 호스팅하는 데 사용할 수 있는 Docker 이미지로도 제공됩니다. 또는 현재 무료 앱과 REST API를 모두 구동하는 GroupDocs.Parser 고급 코드 API를 사용하여 자체 서비스를 구축할 수도 있습니다.

문서 파서 REST API 기능

PDF, 워드 프로세싱 문서, 스프레드시트 및 프레젠테이션 구문 분석

Microsoft Word, Excel, PowerPoint 및 OpenDocument 템플릿 파일 구문 분석

MS Word, Excel 및 PowerPoint용 매크로 지원 문서 및 템플릿 구문 분석

전체 문서에서 텍스트 내용 추출

특정 페이지에서 텍스트 및 이미지 추출

추출 모드를 설정하여 서식 있는 텍스트를 추출합니다.

ZIP 아카이브 또는 이메일의 문서에서 텍스트 추출

이메일, PDF 포트폴리오 및 MS Outlook 저장소에서 문서 검색

문서 페이지 수 및 기타 정보 얻기

문서에서 이미지 추출

GroupDocs.Parser Cloud API는 문서에서 이미지를 추출하는 여러 가지 방법을 제공합니다. 문서 전체에서 모든 이미지를 추출할 수 있으며, 페이지 범위를 설정하여 특정 페이지에서만 이미지를 추출할 수 있습니다. 다음 예제는 컨테이너 내부의 문서에서 이미지를 추출하는 방법을 보여줍니다.

PDF 포트폴리오에서 이미지 추출 - Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";

Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);

FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");

ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");

ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);

ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);

// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

Extract images from Documents using GroupDocs.Parser Free App

JP2MHTMLXLAMXLTPPSPNGEMLXPSTOTTDOTXLSMDOCMPOTXEPUBXLSTXTEMLXLSBXLTXFB2OTSPDFBZ2OSTCSVRTFCHMJPGTIFFPPSMPOTHTMLPPTMODPOTPRARGZTIFJPEGODTPPTGIFXHTMLDOCXXLSXPPTXZIPBMPXLTMPPSXPOTMDOTXONEMDMSGODSXMLXLADOTMTARDOC

Extract images from Documents using GroupDocs.Parser Free App

POTEPUBXLSBXLSXJPGDOTXXHTMLODSOTPOTTPPTMEMLPSTDOTZIPDOTMPPSCSVTIFXLTEMLXDOCXODTRARMHTMLPPTXMSGXMLFB2GIFXLTXXLTMBMPCHMHTMLTXTPOTXPPSXXLAMMDOTSTARXLSMDOCJPEGGZPPSMPPTXLSRTFODPPOTMPDFONEBZ2XLAOSTJP2DOCMTIFFPNG

Support and Learning Resources

GroupDocs.Parser Cloud는 아래 나열된 다른 언어에 대한 개별 문서 구문 분석 SDK도 제공합니다.

  한국어