HTML JPG PDF XML DOCX
  Product Family
PDF

在 Java SDK 中获取 PDF 表格

使用服务器端 Java API 从 PDF 文档获取所有表格

Get Started

如何通过云 Java SDK 从 PDF 中提取表格

为了通过云 Java SDK 提取 PDF 中的表格,我们将使用 Aspose.PDF Cloud Java SDK 此云 SDK 可让您轻松使用 Java 语言在各种云平台上构建基于云的 PDF 创建、编辑和转换应用程序。打开 存储库 在包管理器中搜索 Aspose.PDF Cloud 并安装。您也可以使用以下命令从包管理器控制台安装它。

将 Aspose Cloud 仓库添加到您的应用程序 pom.xml 中

添加 Aspose Cloud 仓库


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

要将 API 客户端库安装到本地 Maven 仓库,只需执行以下操作:

从 Github 安装


    mvn clean install

要将其部署到远程 Maven 仓库,请配置仓库设置并执行以下操作:

部署 Maven 仓库


    mvn clean deploy

通过 Java SDK 提取 PDF 表格的步骤

Aspose.PDF Cloud 开发者可以轻松在几行代码中加载并获取 PDF 表格。

  1. 使用您的应用程序密钥和密钥创建一个新的 Configuration 对象。
  2. 创建一个对象以连接到云 API。
  3. 将 PDF 上传到云存储。
  4. 使用 getDocumentTables 函数从云存储中的 PDF 提取表格。
  5. 检查响应并记录结果。
  6. 如果操作成功,打印表格
 

此示例代码展示了从 PDF 文档中提取表格


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtarctAll {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getDocumentTables(PDF_DOCUMENT, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

在 PDF 中使用表格

表格提供了一种结构化的格式,以系统化地呈现数据,使读者更容易理解和分析信息。它们还能提升文档的视觉效果,增添专业性和条理性。在处理数值或比较数据时,表格通过将相关信息以易于阅读的格式进行分组,提高了清晰度。此外,表格还可以嵌入实时或动态生成的内容,例如来自数据库或分析仪表板的数据。 使用 Aspose.PDF Cloud Java SDK 获取 PDF 文档中的所有表格。

使用我们的 Java 库,您可以:

  • 添加 PDF 文档的页眉和页脚(文本或图像格式)。
  • 向 PDF 文档添加表格和盖章(文本或图像)。
  • 将多个 PDF 文档追加到现有文件。
  • 处理 PDF 附件、注释和表单字段。
  • 对 PDF 文档进行加密或解密并设置密码。
  • 从页面或整个 PDF 文档中删除所有印章和表格。
  • 按 ID 删除 PDF 文档中的特定印章或表格。
  • 替换 PDF 页面或整篇文档中的单个或多个文本实例。
  • 广泛支持将 PDF 文档转换为多种其他文件格式。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以尝试我们的免费应用在线将表格提取到 PDF 文件,并测试其功能。

  •