通过 Ruby SDK 解析您的文档并自动处理文档

使用 Ruby REST API 构建文档处理解决方案。将我们的统一 API 用于不同的文档类型,而无需担心文件格式的细节。

开始免费试用

GroupDocs.Parser Cloud SDK for Ruby,是一个强大的 REST API 文档数据解析解决方案,允许解析超过 50 种文档类型。 SDK 允许以统一的方式构建文档处理自动化解决方案。无论您收到何种文档格式 - PDF 或 DOCX 或任何其他受支持的格式,您都可以使用统一的 API 提取数据。 通过模板解析是一个很有价值的功能,但 API 还提供了其他方法来提取图像和文本。

文档解析器 REST API 功能

解析 PDF、文字处理文档、电子表格和演示文稿

解析 Microsoft Word、Excel、PowerPoint 和 OpenDocument 模板文件

为 MS Word、Excel 和 PowerPoint 解析启用宏的文档和模板

从整个文档中提取文本内容

从特定页面中提取文本和图像

通过设置提取模式提取格式化文本

从 ZIP 档案或电子邮件中的文档中提取文本

从电子邮件、PDF 组合和 MS Outlook 存储中检索文档

获取文档页数和其他信息

从文档中提取图像

GroupDocs.Parser Cloud API,提供了几种从文档中提取图像的方法。您可以从整个文档中提取所有图像,通过设置页面范围从特定页面中提取图像。以下示例显示如何按页码范围从文档中提取图像。

按页码范围提取图像 - Ruby

# For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-ruby-samples
require 'groupdocs_viewer_cloud'

$app_sid = "XXXX-XXXX-XXXX-XXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud
$app_key = "XXXXXXXXXXXXXXXX" # Get AppKey and AppSID from https://dashboard.groupdocs.cloud

parseApi = GroupDocsParserCloud::ParseApi.from_keys($app_sid, $app_key)

options = GroupDocsParserCloud::ImagesOptions.new
options.file_info = GroupDocsParserCloud::FileInfo.new
options.file_info.file_path = "slides/three-slides.pptx"

options.start_page_number = 1
options.count_pages_to_extract = 2

request = GroupDocsParserCloud::ImagesRequest.new(options)
response = parseApi.images(request)
    ```

支持和学习资源

GroupDocs.Parser Cloud 还为其他语言提供单独的文档解析 SDK,如下所示:

  中文