40を超える一般的なドキュメント形式からデータを抽出します。バッチプロセスでテンプレートを適用してドキュメントを解析します。
無料トライアルを開始GroupDocs.Parser Cloud for Pythonを使用すると、50を超える一般的なドキュメントタイプのデータを解析できます。テキスト抽出、画像抽出、テンプレートによるデータの解析は、GroupDocs.Parserの最も価値のある機能であり、CloudRESTAPIサービスで利用できます。 SDKを使用すると、事前定義されたテンプレートを適用するだけで、多くのドキュメント処理自動化タスクを解決し、データを簡単に抽出できます。 通常のドキュメントに加えて、PythonアプリケーションのZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのパスワードで保護されたファイルやコンテナでサポートされている機能を使用できます。
PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する
Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します
MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する
ドキュメント全体からテキストコンテンツを抽出する
特定のページからテキストと画像を抽出する
抽出モードを設定してフォーマットされたテキストを抽出する
ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します
電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します
ドキュメントのページ数やその他の情報を取得する
GroupDocs.Parser Cloud APIを使用すると、テンプレートによってドキュメントからデータを抽出できます。請求書、領収書、レポートなどの一般的なドキュメントのテンプレートを定義し、テンプレートを適用して、さらに処理するためにデータを簡単に抽出できます。次の例は、テンプレートごとにデータを抽出する方法を示しています。
# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud
app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)
options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"
request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
```