HTML JPG PDF XML DOCX
  Product Family
PDF

Analizar PDF para extraer textos en .NET SDK

API para analizar documentos PDF y extraer textos usando API de .NET del lado del servidor.

Get Started

Cómo analizar documentos PDF para extraer textos usando Cloud .NET SDK

Para analizar documentos PDF para extraer textos a través de Cloud .NET SDK, usaremos Aspose.PDF Cloud .NET SDK Este Cloud .NET SDK te permite construir fácilmente aplicaciones de creador, editor y convertidor de PDF basadas en la nube en C#, ASP.NET u otros lenguajes .NET para diversas plataformas en la nube. Abre NuGet gestor de paquetes, busca Aspose.PDF Cloud e instala. También puedes usar el siguiente comando desde la Consola del Administrador de Paquetes.

Comando de Consola del Administrador de Paquetes


     
    PM> Install-Package Aspose.Pdf-Cloud
     
     

Pasos para analizar PDF para extraer textos usando .NET SDK

Los desarrolladores de Aspose.PDF Cloud pueden analizar fácilmente documentos PDF para extraer textos. Los desarrolladores solo necesitan unas pocas líneas de código.

  1. Crea un nuevo objeto de Configuración con tu Secreto y Clave de Aplicación
  2. Crea un objeto para conectarte a la API de Cloud
  3. Sube tu archivo de documento
  4. Analiza documentos PDF para extraer textos en almacenamiento en la nube usando la función GetDocumentTextBoxFieldsAsync
  5. Verifica la respuesta y registra el resultado
  6. Si la operación fue exitosa, imprime los textos extraídos
 

Este código de ejemplo muestra el análisis de un documento PDF para extraer textos


using Aspose.Pdf.Cloud.Sdk.Model;

namespace Parser
{
    public class GetTextBoxes
    {
        public static async Task Extract(string documentName, string remoteFolder)
        {
		// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required). 
		pdfApi = new PdfApi(AppSecret, AppSid);

                using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
		{ // Upload the local PDF to cloud storage folder name.
                    FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
                    Console.WriteLine(uploadResponse.Uploaded[0]);
                }

                // Parse PDF to extract text boxes in cloud storage.
                TextBoxFieldsResponse response = await pdfApi.GetDocumentTextBoxFieldsAsync(documentName, folder: remoteFolder);

                // Checks the response and logs the result.
                if (response == null)
                    Console.WriteLine("GetTextBoxes(): Unexpected error!");
                else if (response.Code < 200 || response.Code > 299)
                    Console.WriteLine("GetTextBoxes():  Failed to receive TextBox fields from the document.");
                else
                { // Show text boxes.
                    Console.WriteLine("GetTextBoxes(): TextBox fields successfully received from the document '{0}.", documentName);
                    foreach (TextBoxField textBox in response.Fields.List)
                    {
                        Console.WriteLine(textBox.ToString());
                    }
                }
            }
        }
    }
 

Trabajar con el análisis de texto en PDF a través de .NET SDK

Al analizar documentos PDF para la extracción de textos, puedes modificar el contenido de los campos de TextBox según sea necesario. Esto mantiene la posición del texto en los documentos mientras ahorra tiempo y reduce el trabajo manual. Analiza documentos PDF para extraer textos con Aspose.PDF Cloud .NET SDK.

Con nuestro SDK .NET puedes

  • Añadir encabezado y pie de página del documento PDF en formato de texto o imagen.
  • Añadir tablas y sellos de texto o imagen a los documentos PDF.
  • Adjuntar múltiples documentos PDF a un archivo existente.
  • Trabajar con adjuntos, anotaciones y campos de formulario PDF.
  • Aplicar cifrado o descifrado a documentos PDF y establecer una contraseña.
  • Eliminar todos los sellos y tablas de una página o de todo el documento PDF.
  • Eliminar un sello o tabla específico del documento PDF por su ID.
  • Reemplazar una o múltiples instancias de texto en una página PDF o en todo el documento.
  • Soporte extenso para convertir documentos PDF a varios otros formatos de archivo.
  • Extraer varios elementos de archivos PDF y optimizar documentos PDF.
  • Puedes probar nuestra App gratuita para probar la funcionalidad.

  •