GroupDocs.Parser Cloud for Pythonを使用すると、50を超える一般的なドキュメントタイプのデータを解析できます。テキスト抽出、画像抽出、テンプレートによるデータの解析は、GroupDocs.Parserの最も価値のある機能であり、CloudRESTAPIサービスで利用できます。 SDKを使用すると、事前定義されたテンプレートを適用するだけで、多くのドキュメント処理自動化タスクを解決し、データを簡単に抽出できます。通常のドキュメントに加えて、PythonアプリケーションのZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのパスワードで保護されたファイルやコンテナでサポートされている機能を使用できます。

で
一目
サポートされています
ファイル形式
プラットホーム
独立

ドキュメントパーサーCloudAPIでサポートされている機能の概要。‎

特徴

*ドキュメントを解析する *テンプレートごとにドキュメントを解析する *テキストを抽出する *画像を抽出する *メタデータを抽出する

ドキュメントから抽出

*メール *電子書籍 *PDFファイル *PDFポートフォリオ *ZIPアーカイブ内のファイル *テキストおよびマークアップドキュメント

Microsoft＆OpenDocument

GroupDocs.Parser

ドキュメントパーサーCloudAPIでサポートされている形式。

MicrosoftOfficeの形式

ワードプロセッシング：DOC、DOCX、DOCM、DOT、DOTX、DOTM
スプレッドシート：XLS、XLSX、XLSM、XLSB、XLT、XLTX、XLTM、XLA、XLAM
プレゼンテーション：PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM
** OneNote **：ONE

OpenDocumentおよびその他の形式

** OpenDocument形式**：ODT、OTT、ODS、OTS、ODP、OTP
テキスト：TXT、RTF
マークアップ：HTML、XHTML、MHTML、MD、XML
ポータブルフォーマット：PDF
メール：PST、OST、EML、EMLX、MSG
** eBook形式**：EPUB、FB2、CHM
その他：数字、CSV、ZIP

GroupDocs.Parser

サポートされているオペレーティングシステムとフレームワーク

よくある質問

オンラインでファイルを解析できる独自の Python アプリケーションを作成したいですか?

クラウドでファイルを解析するためのソースコードを探している場合は、GitHub で Python 用 Cloud SDK を確認してください。

Python で GroupDocs.Parser REST API を無料で試すことはできますか?

GroupDocs.Parser を試すローコード Python API を制限なく使用できます。

機密ファイルをどこにもアップロードしたくありませんか?私のオプションは何ですか？

GroupDocs.Parser Cloud は、サービスをセルフホストするために使用できる Docker イメージとしても利用できます。または、GroupDocs.Parser ハイコード API を使用して独自のサービスを構築することもできます。これは現在、無料アプリと REST API の両方を駆動しています。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

テンプレートを適用してドキュメントからデータを抽出する

GroupDocs.Parser Cloud APIを使用すると、テンプレートによってドキュメントからデータを抽出できます。請求書、領収書、レポートなどの一般的なドキュメントのテンプレートを定義し、テンプレートを適用して、さらに処理するためにデータを簡単に抽出できます。次の例は、テンプレートごとにデータを抽出する方法を示しています。

テンプレートによってドキュメントからデータを抽出する-Python

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-python-samples
import groupdocs_parser_cloud

app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = groupdocs_parser_cloud.ParseApi.from_keys(app_sid, app_key)

options = groupdocs_parser_cloud.ParseOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "words-processing/docx/companies.docx"
options.template_path = "templates/companies.json"

request = groupdocs_parser_cloud.ParseRequest(options)
result = parseApi.parse(request)
    ```

このドキュメント解析RESTAPIとPythonSDKにより、ドキュメント処理が容易になりました

GroupDocs.Parser
Cloud SDK ために Python

よくある質問

オンラインでファイルを解析できる独自の Python アプリケーションを作成したいですか?

Python で GroupDocs.Parser REST API を無料で試すことはできますか?

機密ファイルをどこにもアップロードしたくありませんか?私のオプションは何ですか？

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

テンプレートを適用してドキュメントからデータを抽出する

テンプレートによってドキュメントからデータを抽出する-Python

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

サポートと学習リソース

学習リソース

製品サポート

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

GroupDocs.Parser
Cloud ために cURL

GroupDocs.Parser
Cloud SDK ために .NET

GroupDocs.Parser
Cloud SDK ために Java

GroupDocs.Parser
Cloud SDK ために PHP

GroupDocs.Parser
Cloud SDK ために Ruby

GroupDocs.Parser
Cloud SDK ために Node.js

このドキュメント解析RESTAPIとPythonSDKにより、ドキュメント処理が容易になりました

GroupDocs.ParserCloud SDK ために Python

よくある質問

オンラインでファイルを解析できる独自の Python アプリケーションを作成したいですか?

Python で GroupDocs.Parser REST API を無料で試すことはできますか?

機密ファイルをどこにもアップロードしたくありませんか?私のオプションは何ですか？

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

テンプレートを適用してドキュメントからデータを抽出する

テンプレートによってドキュメントからデータを抽出する-Python

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

サポートと学習リソース

学習リソース

製品サポート

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

GroupDocs.ParserCloud ために cURL

GroupDocs.ParserCloud SDK ために .NET

GroupDocs.ParserCloud SDK ために Java

GroupDocs.ParserCloud SDK ために PHP

GroupDocs.ParserCloud SDK ために Ruby

GroupDocs.ParserCloud SDK ために Node.js

GroupDocs.Parser
Cloud SDK ために Python

GroupDocs.Parser
Cloud ために cURL

GroupDocs.Parser
Cloud SDK ために .NET

GroupDocs.Parser
Cloud SDK ために Java

GroupDocs.Parser
Cloud SDK ために PHP

GroupDocs.Parser
Cloud SDK ために Ruby

GroupDocs.Parser
Cloud SDK ために Node.js