HTML JPG PDF XML DOCX
  Product Family
PDF

Analyser les PDF pour extraire des textes dans .NET SDK

API pour analyser des documents PDF afin d’extraire des textes en utilisant l’API .NET côté serveur.

Get Started

Comment analyser des documents PDF pour extraire des textes en utilisant Cloud .NET SDK

Pour analyser des documents PDF pour extraire des textes via Cloud .NET SDK, nous utiliserons Aspose.PDF Cloud .NET SDK Ce Cloud .NET SDK vous permet de construire facilement des applications créatrices, éditrices et de conversion de PDF basées sur le cloud en C#, ASP.NET ou d’autres langages .NET pour diverses plateformes cloud. Ouvrir NuGet gestionnaire de paquets, recherchez Aspose.PDF Cloud et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de paquets.

Commande de la console du gestionnaire de paquets


     
    PM> Install-Package Aspose.Pdf-Cloud
     
     

Étapes pour analyser des PDF pour extraire des textes en utilisant .NET SDK

Les développeurs d’Aspose.PDF Cloud peuvent facilement analyser des documents PDF pour extraire des textes. Les développeurs ont besoin de seulement quelques lignes de code.

  1. Créez un nouvel objet Configuration avec votre Secret d’Application et Clé
  2. Créez un objet pour se connecter à l’API Cloud
  3. Téléchargez votre fichier de document
  4. Analyser les documents PDF pour extraire des textes dans le stockage cloud en utilisant la fonction GetDocumentTextBoxFieldsAsync
  5. Vérifiez la réponse et enregistrez le résultat
  6. Si l’opération a réussi, imprimez les textes extraits
 

Ce code d'exemple montre l'analyse de document PDF pour extraire des textes


using Aspose.Pdf.Cloud.Sdk.Model;

namespace Parser
{
    public class GetTextBoxes
    {
        public static async Task Extract(string documentName, string remoteFolder)
        {
		// Get your AppSid and AppSecret from https://dashboard.aspose.cloud (free registration required). 
		pdfApi = new PdfApi(AppSecret, AppSid);

                using (var file = File.OpenRead(Path.Combine(localFolder, documentName)))
		{ // Upload the local PDF to cloud storage folder name.
                    FilesUploadResult uploadResponse = await pdfApi.UploadFileAsync(Path.Combine(remoteFolder, documentName), documentName);
                    Console.WriteLine(uploadResponse.Uploaded[0]);
                }

                // Parse PDF to extract text boxes in cloud storage.
                TextBoxFieldsResponse response = await pdfApi.GetDocumentTextBoxFieldsAsync(documentName, folder: remoteFolder);

                // Checks the response and logs the result.
                if (response == null)
                    Console.WriteLine("GetTextBoxes(): Unexpected error!");
                else if (response.Code < 200 || response.Code > 299)
                    Console.WriteLine("GetTextBoxes():  Failed to receive TextBox fields from the document.");
                else
                { // Show text boxes.
                    Console.WriteLine("GetTextBoxes(): TextBox fields successfully received from the document '{0}.", documentName);
                    foreach (TextBoxField textBox in response.Fields.List)
                    {
                        Console.WriteLine(textBox.ToString());
                    }
                }
            }
        }
    }
 

Travailler avec l'analyse de textes dans PDF via .NET SDK

En analysant des documents PDF pour extraire des textes, vous pouvez modifier le contenu des champs TextBox selon les besoins. Cela maintient la position du texte dans les documents tout en économisant du temps et en réduisant le travail manuel. Analyser des documents PDF pour extraire des textes avec Aspose.PDF Cloud .NET SDK.

Avec notre SDK .NET vous pouvez

  • Ajouter l’en-tête et le pied de page du document PDF en format texte ou image.
  • Ajouter des tableaux et des tampons texte ou image aux documents PDF.
  • Ajouter plusieurs documents PDF à un fichier existant.
  • Travailler avec les pièces jointes, annotations et champs de formulaire PDF.
  • Appliquer le cryptage ou le décryptage aux documents PDF et définir un mot de passe.
  • Supprimer tous les tampons et tableaux d’une page ou d’un document PDF entier.
  • Supprimer un tampon ou un tableau spécifique du document PDF par son ID.
  • Remplacer une ou plusieurs instances de texte sur une page PDF ou dans l’ensemble du document.
  • Support étendu pour la conversion de documents PDF en divers autres formats de fichier.
  • Extraire divers éléments des fichiers PDF et optimiser les documents PDF.
  • Vous pouvez essayer notre application gratuite pour tester la fonctionnalité.

  •