HTML JPG PDF XML DOCX
  Product Family
PDF

通过 Go SDK 解析 PDF 以提取图像

使用服务器端 Go API 解析 PDF 文档以提取图像的 API。

Get Started

如何使用 Cloud Go SDK 解析 PDF 文档以提取图像

为了通过 Cloud Go SDK 解析 PDF 文档以提取图像,我们将使用 Aspose.PDF Cloud Go SDK 此 Cloud Go SDK 帮助 Go 程序员开发基于云的 PDF 创建、注释、编辑、转换和解析应用程序,使用 Go 编程语言通过 Aspose.PDF REST API。使用以下命令从软件包管理器控制台。

软件包管理器控制台命令


     
    go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
     
     

使用 Go SDK 解析 PDF 以提取图像的步骤

Aspose.PDF Cloud 开发人员可以轻松地解析 PDF 文档以提取图像。开发人员只需几行代码。

  1. 使用您的应用程序密钥和密钥创建一个新的配置对象
  2. 创建一个对象以连接到云 API
  3. 上传您的文档文件
  4. 使用 GetImages 和 GetImageExtractAsPng 函数在云存储中解析 PDF 文档以提取图像
  5. 检查响应并记录结果
  6. 如果操作成功,打印提取的图像
 

此示例代码展示了如何解析 PDF 文档以提取图像


package main

import (
	"fmt"
	"path"

	asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)

// Extract Images from the document to PNG files
func ParseExtractImages(documentName string, pageNumber int32, localFolder string, remoteFolder string) {
	
	// Get your AppSecret and Key from https://dashboard.aspose.cloud (free registration required).
	pdf_api := asposepdfcloud.NewPdfApiService(APP_SID, APP_KEY, "")

	args := map[string]interface{}{
		"folder": remoteFolder,
	}

	file, _ := os.Open(path.Join(localFolder, documentName))	
	_, _, _ = pdf_api.UploadFile(path.Join(remoteFolder, documentName), file, args)

	respImages, httpResponse, err := pdf_api.GetImages(documentName, pageNumber, args)
	if err != nil {
		fmt.Println(err.Error())
	} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
		fmt.Println("ParseExtractImages(): Failed to extract images from the page of document.")
	} else {
		for _, image := range respImages.Images.List {

			response, httpResponse, err := pdf_api.GetImageExtractAsPng(documentName, image.Id, args)

			if err != nil {
				fmt.Println(err.Error())
			} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
				fmt.Println("ParseExtractImages(): Failed to extract image.")
			} else {
				fmt.Println("ParseExtractImages(): Images'" + image.Id + "' successfully extracted from the page of document.")

				fileName := path.Join(localFolder, (image.Id + ".png"))
				f, _ := os.Create(fileName)
				_, _ = f.Write(response)
				fmt.Println("File '" + fileName + "' successfully downloaded.")
			}
		}
	}
}
 

通过 Go SDK 处理 PDF 中的图像解析

通过解析 PDF 文档以提取图像,可以系统地验证每个图像的有效性和相关性,确保所有引用都是最新的并且功能正常。对于诸如下载链接图像或进行批量分析的任务,提取图像可以实现自动化,节省时间并减少人工工作。 使用 Aspose.PDF Cloud Go SDK 解析 PDF 文档以提取图像。

使用我们的 Go SDK,您可以

  • 添加 PDF 文档的文本或图像格式的页眉和页脚。
  • 向 PDF 文档添加表格和文本或图像戳记。
  • 将多个 PDF 文档附加到现有文件。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档应用加密或解密并设置密码。
  • 从页面或整个 PDF 文档中删除所有戳记和表格。
  • 按 ID 从 PDF 文档中删除特定戳记或表格。
  • 替换 PDF 页面或整个文档中的一个或多个文本实例。
  • 支持将 PDF 文档转换为各种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以尝试我们的免费应用来测试功能。

  •