cURLを使用してドキュメントを解析し、データを抽出します

Word、Excel、Web、eBook、Email、ZIPアーカイブからPDFおよびファイル形式を解析し、REST APIを使用してテキスト、画像、およびメタデータを抽出します。

無料トライアルを開始

GroupDocs.Parser Cloud for cURLを使用すると、ほとんどすべての一般的なビジネスドキュメント形式の解析とデータ抽出が可能になります。単純なcURLコマンドを使用します。テキストと画像は、ドキュメント全体または特定のページ範囲から抽出できます。 REST APIは、解析され、画像、ドキュメント情報、およびコンテナー項目の詳細を抽出するZIPなどのアーカイブもサポートします。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ドキュメントからテキストを抽出する

GroupDocs.Parser Cloud APIを使用すると、クラウドストレージに配置されたドキュメントから画像、テキスト、メタデータをすばやく抽出できます。次の簡単なcURLコマンドは、ドキュメントからテキストを抽出する方法を示しています。

MSWord文書を解析してテキストを抽出する-cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

サポートおよび学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語