cURLを使用してドキュメントを解析し、データを抽出します

Word、Excel、Web、eBook、Email、ZIPアーカイブからPDFおよびファイル形式を解析し、REST APIを使用してテキスト、画像、およびメタデータを抽出します。

  • GroupDocs.Parser Cloud SDK for .NET
  • GroupDocs.Parser Cloud SDK for Java
  • GroupDocs.Parser Cloud SDK for PHP
  • GroupDocs.Parser Cloud SDK for Python
  • GroupDocs.Parser Cloud SDK for Ruby
  • GroupDocs.Parser Cloud SDK for Node.js
無料トライアルを開始

GroupDocs.Parser Cloud for cURLを使用すると、ほとんどすべての一般的なビジネスドキュメント形式の解析とデータ抽出が可能になります。単純なcURLコマンドを使用します。テキストと画像は、ドキュメント全体または特定のページ範囲から抽出できます。 REST APIは、解析され、画像、ドキュメント情報、およびコンテナー項目の詳細を抽出するZIPなどのアーカイブもサポートします。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ドキュメントからテキストを抽出する

GroupDocs.Parser Cloud APIを使用すると、クラウドストレージに配置されたドキュメントから画像、テキスト、メタデータをすばやく抽出できます。次の簡単なcURLコマンドは、ドキュメントからテキストを抽出する方法を示しています。

MSWord文書を解析してテキストを抽出する-cURL

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

MHTMLPSTEPUBXLTMPOTMGZCHMDOCXOTPODPBZ2PDFTARODTXLSXMDTIFFPPTXDOCMOTSPOTXDOTODSFB2XMLMSGEMLJPGCSVXLSBRARPNGXLAMBMPPOTXLSPPSOTTTIFTXTOSTPPSMXLTXZIPEMLXPPTJPEGPPSXPPTMDOTXXHTMLHTMLJP2GIFXLAXLSMDOCXLTRTFDOTMONE

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

PNGEPUBRARTIFFHTMLDOCTXTXHTMLPPTTIFCHMPOTXDOCXEMLXONEXLTMXLTXODPXLSBPPSMXLSMXLSXXMLODSMDODTJPGBMPBZ2POTMFB2GIFPDFPPSOTSEMLMHTMLXLTPPTMXLAJP2OTTTARXLSCSVMSGOTPDOTZIPDOCMDOTMPSTPPSXGZPPTXDOTXRTFPOTOSTJPEGXLAM

サポートと学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語