このRESTAPIとNode.jsCloudSDKを使用して、ドキュメントからデータを抽出します

40以上のドキュメント形式からテキスト、画像、メタデータ、その他のデータを抽出します。テンプレートを適用して、テーブルまたは特定のデータフィールドを抽出します。

無料トライアルを開始

GroupDocs.Parser Cloud for Node.jsは、50を超えるドキュメントタイプを解析するためのドキュメントデータ抽出RESTAPIのラッパーです。さまざまなモードでテキストを抽出し、画像を抽出し、事前定義されたテンプレートを使用してドキュメントを解析することは、GroupDocs.ParserCloudAPIの最も一般的な機能です。 APIは、Node.jsアプリケーションで、ZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのパスワードで保護されたファイルとコンテナをサポートします。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ドキュメントからフォーマットされたテキストを抽出する

GroupDocs.Parser Cloud APIは、ドキュメントからテキストを抽出するいくつかの方法を提供します。次の例は、ドキュメントからフォーマットされたテキストを抽出する方法を示しています。

ドキュメントからフォーマットされたテキストを抽出する-Node.js

// For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node-samples
global.parser_cloud = require("groupdocs-parser-cloud");

global.appSid = "XXXX-XXXX-XXXX-XXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
global.appKey = "XXXXXXXXXXXXXXXX"; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud

global.parseApi = parser_cloud.ParseApi.fromKeys(appSid, appKey);

let fileInfo = new parser_cloud.FileInfo();
fileInfo.filePath = "words-processing/docx/formatted-document.docx";

let options = new parser_cloud.TextOptions();
options.fileInfo = fileInfo;

let formattedTextOptions = new parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "Markdown";
options.formattedTextOptions = formattedTextOptions;

let request = new parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
    ```

サポートおよび学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語