Анализ PDF для извлечения полей формы в формате XML в SDK для Python
API для анализа PDF-документов с целью извлечения полей формы в формате XML с использованием серверного API для Python.
Get StartedКак анализировать PDF-документы для извлечения полей формы в формате XML с использованием облачного SDK для Python
Для анализа PDF-документов и извлечения полей формы в формате XML через облачный SDK для Python мы будем использовать Aspose.PDF Cloud Python SDK Этот облачный SDK помогает программистам на Python разрабатывать облачные приложения для создания, аннотирования, редактирования, конвертации и анализа PDF с использованием REST API Aspose.PDF. Просто создайте учетную запись на Aspose for Cloud и получите информацию о вашем приложении. Как только у вас будут SID и ключ приложения, вы готовы использовать Aspose.PDF Cloud Python SDK. Если пакет Python размещен на Github, вы можете установить его напрямую с Github:
Установка с Github
pip install git+https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python.git
Команда консоли диспетчера пакетов
pip install asposepdfcloud
Шаги для анализа PDF для извлечения полей формы в формате XML с использованием SDK для Python
Разработчики Aspose.PDF Cloud могут легко анализировать PDF-документы для извлечения полей формы в формате XML. Разработчикам нужно всего несколько строк кода.
- Создайте новый объект Configuration с вашим секретом приложения и ключом
- Создайте объект для подключения к Cloud API
- Загрузите ваш файл документа
- Проанализируйте PDF-документы для извлечения полей формы в формате XML в облачном хранилище с помощью функции put_export_fields_from_pdf_to_xml_in_storage
- Проверьте ответ и запишите результат в журнал
- Загрузите XML-файл локально, если необходимо
Этот пример кода показывает анализ PDF-документа для извлечения полей формы в формате XML
import shutil
import json
import logging
from pathlib import Path
from asposepdfcloud import ApiClient, PdfApi
import logging
# Configure logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
class ExportFormToXML:
"""Class for extracting PDF form fields into XML using Aspose PDF Cloud API."""
def __init__(self):
self.pdf_api = PdfApi(ApiClient(APP_KEY, APP_SID)
def uploadDocument(self, documentName: str, localFolder: str, remoteFolder: str):
"""Upload a PDF document to the Aspose Cloud server."""
if self.pdf_api:
file_path = localFolder / documentName
try:
if remoteFolder == None:
self.pdf_api.upload_file(documentName, str(file_path))
else:
opts = { "folder": remoteFolder }
self.pdf_api.upload_file(remoteFolder + '/' + documentName, file_path)
logging.info(f"File {documentName} uploaded successfully.")
except Exception as e:
logging.error(f"Failed to upload file: {e}")
def downloadFile(self, document: str, outputDocument: str, localFolder: Path, remoteFolder: str, output_prefix: str):
"""Download the processed PDF document from the Aspose Cloud server."""
if self.pdf_api:
try:
temp_file = self.pdf_api.download_file(remoteFolder + '/' + document)
local_path = localFolder / ( output_prefix + outputDocument )
shutil.move(temp_file, str(local_path))
logging.info(f"download_result(): File successfully downloaded: {local_path}")
except Exception as e:
logging.error(f"download_result(): Failed to download file: {e}")
def Extract(self, documentName: str, outputXMLName: str, localFolder: Path, remoteFolder: str ):
self.uploadDocument(documentName, remoteFolder)
XMLPath = str(Path.joinpath(Path(remoteFolder), outputXMLName))
opts = {
"folder": remoteFolder
}
response = self.pdf_put_export_fields_from_pdf_to_xml_in_storage(documentName, XMLPath, **opts)
if response.code != 200:
logging.error("ExportFormToXML(): Unexpected error!")
else:
logging.info(f"ExportFormToXML(): Pdf document '{documentName}' form fields successfully exported to '{outputXMLName}' file.")
self.downloadFile(outputXMLName, outputXMLName, localFolder, remoteFolder, "")
Работа с анализом форм в PDF через SDK для Python
Анализируя PDF-документы для извлечения полей формы в формате XML, можно систематически проверять правильность и актуальность каждого поля формы, обеспечивая актуальность и функциональность всех ссылок. Для таких задач, как загрузка полей формы в формате XML или проведение пакетного анализа, извлечение полей формы позволяет автоматизировать процессы, экономя время и снижая трудозатраты. Анализируйте PDF-документы для извлечения полей формы в формате XML с помощью Aspose.PDF Cloud Python SDK.
С нашим SDK для Python вы можете
- Добавлять заголовок и подвал PDF-документа в текстовом или графическом формате.
- Добавлять таблицы и текстовые или графические штампы в PDF-документы.
- Присоединять несколько PDF-документов к существующему файлу.
- Работать с вложениями PDF, аннотациями и полями формы.
- Применять шифрование или дешифрование к PDF-документам и устанавливать пароль.
- Удалять все штампы и таблицы со страницы или из всего PDF-документа.
- Удалять конкретный штамп или таблицу из PDF-документа по его идентификатору.
- Заменять одно или несколько вхождений текста на странице PDF или во всем документе.
- Обширная поддержка конвертации PDF-документов в различные другие форматы файлов.
- Извлекать различные элементы PDF-файлов и оптимизировать PDF-документы.
- Вы можете попробовать наше бесплатное приложение для тестирования функциональности.
- Учебные ресурсы
- Документация
- Исходный код
- Справочные материалы по API
- Поддержка продукта
- Бесплатная поддержка
- Платная поддержка
- Блог
- Почему Aspose.PDF Cloud для Python?
- Список клиентов
- Безопасность