HTML JPG PDF XML DOCX
  Product Family
PDF

在 Java SDK 中从 PDF 获取页面表格

使用服务器端 Java API 从 PDF 文档获取所有页面表格

Get Started

如何通过云 Java SDK 从 PDF 中提取页面表格

为了通过云 Java SDK 从 PDF 中提取页面表格,我们将使用 Aspose.PDF Cloud Java SDK 此云 SDK 可让您轻松构建基于云的 PDF 创建、编辑和转换应用程序,支持 C#、ASPJava 或其他 Java 语言,适用于各种云平台。打开 Repository 包管理器中搜索 Aspose.PDF Cloud 并安装。您也可以使用以下命令从包管理器控制台通过 Maven 安装它。

将 Aspose Cloud 仓库添加到您的应用程序 pom.xml 中

添加 Aspose Cloud 仓库


    <repositories>
        <repository>
            <id>aspose-cloud</id>
            <name>Aspose Cloud Repository</name>
            <url>https://releases.aspose.cloud/java/repo/</url>
        </repository>
    </repositories>

要将 API 客户端库安装到本地 Maven 仓库,只需执行以下操作:

从 Github 安装


    mvn clean install

若要将其部署到远程 Maven 仓库,请配置仓库设置并执行以下操作:

部署 Maven 仓库


    mvn clean deploy

通过 Java SDK 从 PDF 中提取页面表格的步骤

Aspose.PDF Cloud 开发者只需几行代码即可轻松加载并获取 PDF 中的页面表格。

  1. 使用您的应用程序密钥和密钥创建新的 Configuration 对象。
  2. 创建一个对象以连接到云 API。
  3. 将 PDF 上传到云存储。
  4. 使用 getPageTables 函数从云存储中的 PDF 提取页面表格。
  5. 检查响应并记录结果。
  6. 如果操作成功,打印表格。
 

此示例代码展示了从 PDF 文档中提取页面表格


    import java.io.File;
    import java.nio.file.Path;
    import com.google.gson.Gson;
    import com.google.gson.GsonBuilder;

    import com.aspose.asposecloudpdf.api.PdfApi;
    import com.aspose.asposecloudpdf.model.TableRecognized;
    import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;

    public class TablesExtractOnPage {
        public static void perform() {
            String REMOTE_FOLDER   = "Your_Temp_Pdf_Cloud";
	    String LOCAL_FOLDER    = "c:\\Samples";
	    String PDF_DOCUMENT    = "sample.pdf";
            Integer PAGE_NUMBER    = 1;

            try {
                PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);

                // upload local PDF file to remote storage
                File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
                pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
                System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));

                // paerform actionPDF_OUTPUT
                TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
                if (response.getCode() != 200)
                    System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
                else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
                    System.err.println("Error: Tables not found!");
                }
                else {
                    // Show tables info...
                    Gson gson = new GsonBuilder().setPrettyPrinting().create();
                    for (TableRecognized tab : response.getTables().getList()) {
                        String jsonTab = gson.toJson(tab);
                        System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
 

在 PDF 中使用表格

表格提供了系统化呈现数据的结构化格式,使读者更容易理解和分析信息。它们还提升了文档的视觉吸引力,增加了专业性和组织性。在处理数值或比较数据时,表格通过将相关信息以易读的形式分组,从而提升了清晰度。此外,表格还能整合实时或动态生成的内容,例如来自数据库或分析仪表盘的数据。 使用 Aspose.PDF Cloud Java SDK 获取 PDF 文档中所有页面的表格。

使用我们的 Java 库,您可以:

  • 以文本或图像格式添加 PDF 文档的页眉和页脚。
  • 向 PDF 文档添加表格和印章(文本或图像)。
  • 将多个 PDF 文档附加到现有文件中。
  • 处理 PDF 附件、批注和表单字段。
  • 对 PDF 文档进行加密或解密并设置密码。
  • 删除页面或整个 PDF 文档中的所有印章和表格。
  • 按 ID 删除 PDF 文档中的特定印章或表格。
  • 替换 PDF 页面或整个文档中的单个或多个文本实例。
  • 提供广泛的 PDF 文档转换为多种其他文件格式的支持。
  • 提取 PDF 文件的各种元素并优化 PDF 文档。
  • 您可以试用我们的 免费应用 在线提取 PDF 文件中的表格并测试功能。

  •