HTML
JPG
PDF
XML
DOCX
PDF
如何使用云 Go SDK 从 PDF 文档中提取表格
为了从 PDF 文档中获取表格,我们将使用 Aspose.PDF Cloud Go SDK 这个云 SDK 协助 Go 程序员使用 Go 编程语言通过 Aspose.PDF REST API 开发云端 PDF 创建、注解、编辑和转换应用程序。使用以下命令从包管理器控制台中执行。
包管理器控制台命令
go get -u github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25
使用 Go 获取表格的步骤
Aspose.PDF Cloud Go 开发人员可以轻松从 PDF 文档中提取表格。开发人员只需几行代码。
- 定义 ExtractTables 函数
- 上传 PDF 文件到 Aspose Cloud
- 设置请求参数
- 调用 API 获取文档中的表格
- 检查错误并验证 HTTP 响应
- 如果找到表格,打印表格元数据
此示例代码显示了如何使用 PDF Cloud Go SDK 从 PDF 文档中提取表格
package main
import (
"fmt"
asposepdfcloud "github.com/aspose-pdf-cloud/aspose-pdf-cloud-go/v25"
)
func ExtractTables(pdf_api *asposepdfcloud.PdfApiService, document string, remoteFolder string) {
// Extract all tables form the document and show table info
uploadFile(pdf_api, document)
args := map[string]interface{}{
"folder": remoteFolder,
}
result, httpResponse, err := pdf_api.GetDocumentTables(document, args)
if err != nil {
fmt.Println(err.Error())
} else if httpResponse.StatusCode < 200 || httpResponse.StatusCode > 299 {
fmt.Println("ExtractTables(): Failed to extract tablev from the document.")
} else {
if result.Tables == nil || len(result.Tables.List) == 0 {
fmt.Println("ExtractTables(): Tables not found in the document.")
} else {
for i, t := range result.Tables.List {
fmt.Println("table", i, " => id: '"+t.Id+"', page: '", t.PageNum, "', rows: '", len(t.RowList), "', columns: '", len(t.RowList[0].CellList), "'")
}
}
}
}
通过 Go SDK 处理 PDF 中的表格
表格提供了一种系统化呈现数据的结构化格式,使读者更容易理解和分析信息。它们还增强了文档的视觉吸引力,增加了专业性和组织性。在处理数字或比较数据时,表格通过将相关信息分组为易于阅读的格式,提高了清晰度。此外,表格可以包含实时或动态生成的内容,比如来自数据库或分析仪表板的数据。使用 Aspose.PDF Cloud Go SDK 从 PDF 文档中提取表格。
使用我们的 Go SDK,您可以
- 添加 PDF 文档的文本或图像格式的页眉和页脚。
- 向 PDF 文档中添加表格和文本或图像水印。
- 将多个 PDF 文档追加到现有文件中。
- 处理 PDF 附件、注释和表单字段。
- 对 PDF 文档应用加密或解密并设置密码。
- 删除页面或整个 PDF 文档中的所有水印和表格。
- 按 ID 删除 PDF 文档中的特定水印或表格。
- 替换 PDF 页面或整个文档中的单个或多个文本实例。
- 广泛支持将 PDF 文档转换为各种其他文件格式。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以试用我们的 免费应用 在线获取 PDF 文件中的表格并测试功能。