ドキュメントを解析し、RubySDKを介してドキュメント処理を自動化します

RubyRESTAPIを使用してドキュメント処理ソリューションを構築します。ファイル形式の詳細を気にすることなく、さまざまなドキュメントタイプで統合APIを使用できます。

無料トライアルを開始

GroupDocs.Parser Cloud SDK for Rubyは、50を超えるドキュメントタイプを解析できる強力なRESTAPIドキュメントデータ解析ソリューションです。 SDKを使用すると、ドキュメント処理の自動化ソリューションを統一された方法で構築できます。受け取るドキュメント形式(PDF、DOCX、またはその他のサポートされている形式)に関係なく、統合APIを使用してデータを抽出できます。 テンプレートによる解析は価値のある機能ですが、APIは画像やテキストを抽出する他のメソッドも提供します。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ドキュメントから画像を抽出する

GroupDocs.Parser Cloud APIは、ドキュメントから画像を抽出するいくつかの方法を提供します。ページ範囲を設定することで、ドキュメント全体からすべての画像を抽出したり、特定のページから画像を抽出したりできます。次の例は、ページ番号の範囲でドキュメントから画像を抽出する方法を示しています。

ページ番号範囲で画像を抽出する-Ruby

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-ruby-samples
require 'groupdocs_viewer_cloud'

$app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
$app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = GroupDocsParserCloud::ParseApi.from_keys($app_sid, $app_key)

options = GroupDocsParserCloud::ImagesOptions.new
options.file_info = GroupDocsParserCloud::FileInfo.new
options.file_info.file_path = "slides/three-slides.pptx"

options.start_page_number = 1
options.count_pages_to_extract = 2

request = GroupDocsParserCloud::ImagesRequest.new(options)
response = parseApi.images(request)
    ```

サポートおよび学習リソース

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

  日本語