HTML JPG PDF XML DOCX
  Product Family
PDF

Анализ PDF для извлечения текстов в .NET SDK

API для анализа PDF-документов для извлечения текстов с использованием серверного API .NET.

Get Started

Как анализировать PDF-документы для извлечения текстов с использованием Cloud .NET SDK

Для анализа PDF-документов для извлечения текстов через Cloud .NET SDK, мы будем использовать Aspose.PDF Cloud .NET SDK Этот Cloud .NET SDK позволяет легко создавать облачные приложения для создания, редактирования и конвертации PDF на C#, ASP.NET или других языках .NET для различных облачных платформ. Откройте NuGet менеджер пакетов, найдите Aspose.PDF Cloud и установите. Вы также можете использовать следующую команду из консоли диспетчера пакетов.

Команда консоли диспетчера пакетов


     
    PM> Install-Package Aspose.Pdf-Cloud
     
     

Шаги для анализа PDF для извлечения текстов с использованием .NET SDK

Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения текстов. Разработчикам требуется всего несколько строк кода.

  1. Создайте новый объект Configuration с вашим секретом приложения и ключом
  2. Создайте объект для подключения к Cloud API
  3. Загрузите ваш файл документа
  4. Анализируйте PDF-документы для извлечения текстов в облачном хранилище, используя функцию GetDocumentTextBoxFieldsAsync
  5. Проверьте ответ и запишите результат
  6. Если операция прошла успешно, распечатайте извлеченные тексты
 

Этот пример кода показывает анализ PDF-документа для извлечения текстов


using Aspose.Pdf.Cloud.Sdk.Model;

namespace Parser
{
    public class GetTextBoxes
    {
        public static async Task Extract(string documentName, string remoteFolder)
        {
		// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required). 
		pdfApi = new PdfApi(AppSecret, AppSid);

                using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
		{ // Upload the local PDF to cloud storage folder name.
                    FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
                    Console.WriteLine(uploadResponse.Uploaded[0]);
                }

                // Parse PDF to extract text boxes in cloud storage.
                TextBoxFieldsResponse response = await pdfApi.GetDocumentTextBoxFieldsAsync(documentName, folder: remoteFolder);

                // Checks the response and logs the result.
                if (response == null)
                    Console.WriteLine("GetTextBoxes(): Unexpected error!");
                else if (response.Code < 200 || response.Code > 299)
                    Console.WriteLine("GetTextBoxes():  Failed to receive TextBox fields from the document.");
                else
                { // Show text boxes.
                    Console.WriteLine("GetTextBoxes(): TextBox fields successfully received from the document '{0}.", documentName);
                    foreach (TextBoxField textBox in response.Fields.List)
                    {
                        Console.WriteLine(textBox.ToString());
                    }
                }
            }
        }
    }
 

Работа с анализом текста в PDF через .NET SDK

Анализируя PDF-документы для извлечения текстов, вы можете изменять содержимое полей TextBox по мере необходимости. Это сохраняет позицию текста в документах, экономя время и снижая ручную работу. Анализируйте PDF-документы для извлечения текстов с Aspose.PDF Cloud .NET SDK.

С нашим .NET SDK вы можете

  • Добавить заголовок и нижний колонтитул PDF-документа в текстовом или графическом формате.
  • Добавить таблицы и текстовые или графические штампы в PDF-документы.
  • Присоединить несколько PDF-документов к существующему файлу.
  • Работать с вложениями, аннотациями и полями форм в PDF.
  • Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
  • Удалить все штампы и таблицы со страницы или всего PDF-документа.
  • Удалить определенный штамп или таблицу из PDF-документа по его ID.
  • Заменить одно или несколько вхождений текста на PDF-странице или во всем документе.
  • Широкая поддержка конвертации PDF-документов в различные другие форматы файлов.
  • Извлекать различные элементы PDF-файлов и оптимизировать PDF-документы.
  • Вы можете попробовать наше бесплатное приложение, чтобы протестировать функциональность.

  •