40개 이상의 널리 사용되는 문서 형식에서 데이터를 추출합니다. 템플릿을 적용한 문서를 일괄적으로 파싱합니다.
무료 평가판 시작GroupDocs.Parser Python용 Cloud를 사용하면 50개 이상의 인기 있는 문서 유형에서 데이터를 구문 분석할 수 있습니다. 텍스트 추출, 이미지 추출, 템플릿별 데이터 구문 분석은 GroupDocs.Parser의 가장 중요한 기능이며 Cloud REST API 서비스에서 사용할 수 있습니다. SDK를 사용하면 사전 정의된 템플릿을 적용하는 것만으로 다양한 문서 처리 자동화 작업을 쉽게 해결하고 데이터를 추출할 수 있습니다. 일반 문서와 함께 Python 애플리케이션의 ZIP 아카이브, OST/PST 메일 데이터 파일, eBook, 마크업 및 PDF 포트폴리오와 같은 비밀번호로 보호된 파일 및 컨테이너에서 지원되는 기능을 사용할 수 있습니다.
클라우드에서 파일을 파싱하기 위한 소스 코드를 찾고 있다면 GitHub에서 Python용 Cloud SDK를 확인하세요.
아무런 제한 없이 GroupDocs.Parser 로우 코드 Python API를 사용해 볼 수 있습니다.
GroupDocs.Parser Cloud는 서비스를 자체 호스팅하는 데 사용할 수 있는 Docker 이미지로도 제공됩니다. 또는 현재 무료 앱과 REST API를 모두 구동하는 GroupDocs.Parser 고급 코드 API를 사용하여 자체 서비스를 구축할 수도 있습니다.
GroupDocs.Parser Cloud API를 사용하면 템플릿을 통해 문서에서 데이터를 추출할 수 있습니다. 송장, 영수증, 보고서와 같은 일반적인 문서에 대한 템플릿을 정의할 수 있으며, 추가 처리를 위해 데이터를 쉽게 추출할 수 있는 템플릿을 적용할 수 있습니다. 다음 예시는 템플릿별로 데이터를 추출하는 방법을 보여줍니다.
# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud
app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)
options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"
request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
```