CloudAPIと.NETSDKを使用した解析と抽出

.NET ParserSDKはRESTAPIと通信し、.NETプラットフォームでドキュメント解析およびデータ抽出ツールを構築できるようにします。

無料トライアルを開始

GroupDocs.Parser Cloud SDKを使用すると、.NET開発者は、ドキュメントを解析してテキストを抽出し、.NETベースのアプリケーション内で画像とメタデータを抽出できます。 SDK(REST APIクライアント)は、開発者が開発をスピードアップするための最も簡単で迅速な方法です。これにより、開発者はプロジェクト固有のコードを記述するだけに集中でき、要求の作成と応答の処理に関する低レベルの詳細について心配する必要がなくなります。 ドキュメントは、データフィールド定義とテーブル定義を備えた使いやすいユーザー定義テンプレートで解析できます。次に、テキストフィールド、数字、表などのデータを一般的なドキュメントから、さらにはZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのコンテナからも簡単に抽出できます。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ページ番号範囲でドキュメントからテキストを抽出する

GroupDocs.Parser Cloud APIは、ドキュメントからテキストを抽出するいくつかの方法を提供します。テキストのみを抽出したり、抽出モードを設定してフォーマットされたテキストを抽出したり、ページ範囲を設定して特定のページから抽出したりできます。次の例は、ページ範囲を設定してPDFドキュメントからテキストを抽出する方法を示しています。

PDFドキュメントを解析して、特定のページからテキストを抽出します-C#.NET

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
  string MyAppKey = "";
  string MyAppSid = "";

  var configuration = new Configuration(MyAppSid, MyAppKey);

  var apiInstance = new ParseApi(configuration);
  var fileInfo = new FileInfo
  {
  FilePath = "directory/document.pdf"
  };

  var options = new TextOptions
  {
  FileInfo = fileInfo,
  StartPageNumber = 1,
  CountPagesToExtract = 2
  };

  var request = new TextRequest(options);
  var response = apiInstance.Text(request);

  // For complete examples, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet-samples

サポートおよび学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語