このドキュメント解析RESTAPIとPythonSDKにより、ドキュメント処理が容易になりました

40を超える一般的なドキュメント形式からデータを抽出します。バッチプロセスでテンプレートを適用してドキュメントを解析します。

無料トライアルを開始

GroupDocs.Parser Cloud for Pythonを使用すると、50を超える一般的なドキュメントタイプのデータを解析できます。テキスト抽出、画像抽出、テンプレートによるデータの解析は、GroupDocs.Parserの最も価値のある機能であり、CloudRESTAPIサービスで利用できます。 SDKを使用すると、事前定義されたテンプレートを適用するだけで、多くのドキュメント処理自動化タスクを解決し、データを簡単に抽出できます。 通常のドキュメントに加えて、PythonアプリケーションのZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのパスワードで保護されたファイルやコンテナでサポートされている機能を使用できます。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

テンプレートを適用してドキュメントからデータを抽出する

GroupDocs.Parser Cloud APIを使用すると、テンプレートによってドキュメントからデータを抽出できます。請求書、領収書、レポートなどの一般的なドキュメントのテンプレートを定義し、テンプレートを適用して、さらに処理するためにデータを簡単に抽出できます。次の例は、テンプレートごとにデータを抽出する方法を示しています。

テンプレートによってドキュメントからデータを抽出する-Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

サポートおよび学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語