Анализ и извлечение с помощью Cloud API и .NET SDK

.NET Parser SDK взаимодействует с REST API, что позволяет создавать инструменты анализа документов и извлечения данных на платформе .NET.

Начать бесплатную пробную версию

GroupDocs.Parser Cloud SDK помогает разработчикам .NET анализировать любой документ для извлечения текста, изображений и метаданных в приложениях на основе .NET. SDK (клиент REST API) — это самый простой и быстрый способ для разработчика ускорить разработку. Это позволяет разработчику сосредоточиться только на написании кода для конкретного проекта и не беспокоиться о низкоуровневых деталях создания запросов и обработки ответов. Документы можно анализировать с помощью простых в использовании пользовательских шаблонов с определениями полей данных и определениями таблиц. Затем можно легко извлекать такие данные, как текстовые поля, числа, таблицы, из типичных документов и даже из контейнеров, таких как ZIP-архивы, файлы почтовых данных OST/PST, электронные книги, пометки и портфолио PDF.

Возможности REST API парсера документов

Разбор PDF, текстовых документов, электронных таблиц и презентаций

Разбирать файлы шаблонов Microsoft Word, Excel, PowerPoint и OpenDocument

Анализ документов и шаблонов с поддержкой макросов для MS Word, Excel и PowerPoint

Извлечение текстового содержимого из всего документа

Извлечение текста и изображений с определенных страниц

Извлечь форматированный текст, установив режим извлечения

Извлечение текста из документов в ZIP-архивах или электронных письмах

Извлечение документов из электронных писем, портфолио PDF и хранилищ MS Outlook

Получить количество страниц документа и другую информацию

Извлечь текст из документа по диапазону номеров страниц

GroupDocs.Parser Cloud API предоставляет несколько способов извлечения текста из документов. Вы можете извлекать только текст, извлекать форматированный текст, устанавливая режимы извлечения, извлекать из определенных страниц, устанавливая диапазон страниц. В следующем примере показано, как извлечь текст из документа PDF, установив диапазон страниц.

Анализ PDF-документа для извлечения текста с определенных страниц — C# .NET

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
  string MyAppKey = "";
  string MyAppSid = "";

  var configuration = new Configuration(MyAppSid, MyAppKey);

  var apiInstance = new ParseApi(configuration);
  var fileInfo = new FileInfo
  {
  FilePath = "directory/document.pdf"
  };

  var options = new TextOptions
  {
  FileInfo = fileInfo,
  StartPageNumber = 1,
  CountPagesToExtract = 2
  };

  var request = new TextRequest(options);
  var response = apiInstance.Text(request);

  // For complete examples, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet-samples

Ресурсы поддержки и обучения

GroupDocs.Parser Cloud также предлагает отдельные SDK для синтаксического анализа документов для других языков, перечисленных ниже:

  РУССКИЙ