HTML
JPG
PDF
XML
DOCX
PDF
如何通过云 Java SDK 从 PDF 中提取页面表格
为了通过云 Java SDK 从 PDF 中提取页面表格,我们将使用 Aspose.PDF Cloud Java SDK 此云 SDK 可让您轻松构建基于云的 PDF 创建、编辑和转换应用程序,支持 C#、ASPJava 或其他 Java 语言,适用于各种云平台。打开 Repository 包管理器中搜索 Aspose.PDF Cloud 并安装。您也可以使用以下命令从包管理器控制台通过 Maven 安装它。
将 Aspose Cloud 仓库添加到您的应用程序 pom.xml 中
添加 Aspose Cloud 仓库
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
要将 API 客户端库安装到本地 Maven 仓库,只需执行以下操作:
从 Github 安装
mvn clean install
若要将其部署到远程 Maven 仓库,请配置仓库设置并执行以下操作:
部署 Maven 仓库
mvn clean deploy
通过 Java SDK 从 PDF 中提取页面表格的步骤
Aspose.PDF Cloud 开发者只需几行代码即可轻松加载并获取 PDF 中的页面表格。
- 使用您的应用程序密钥和密钥创建新的 Configuration 对象。
- 创建一个对象以连接到云 API。
- 将 PDF 上传到云存储。
- 使用 getPageTables 函数从云存储中的 PDF 提取页面表格。
- 检查响应并记录结果。
- 如果操作成功,打印表格。
此示例代码展示了从 PDF 文档中提取页面表格
import java.io.File;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.google.gson.GsonBuilder;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TableRecognized;
import com.aspose.asposecloudpdf.model.TablesRecognizedResponse;
public class TablesExtractOnPage {
public static void perform() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
Integer PAGE_NUMBER = 1;
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// paerform actionPDF_OUTPUT
TablesRecognizedResponse response = pdfApi.getPageTables(PDF_DOCUMENT, PAGE_NUMBER, null, REMOTE_FOLDER);
if (response.getCode() != 200)
System.err.println("Error: unexpected error when extracting tables! '" + response.getStatus() + "'");
else if (response.getTables() == null || response.getTables().getList() == null || response.getTables().getList().isEmpty()) {
System.err.println("Error: Tables not found!");
}
else {
// Show tables info...
Gson gson = new GsonBuilder().setPrettyPrinting().create();
for (TableRecognized tab : response.getTables().getList()) {
String jsonTab = gson.toJson(tab);
System.out.println("Table #'"+ tab.getId() + "' !\n" + jsonTab + "\n");
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
在 PDF 中使用表格
表格提供了系统化呈现数据的结构化格式,使读者更容易理解和分析信息。它们还提升了文档的视觉吸引力,增加了专业性和组织性。在处理数值或比较数据时,表格通过将相关信息以易读的形式分组,从而提升了清晰度。此外,表格还能整合实时或动态生成的内容,例如来自数据库或分析仪表盘的数据。 使用 Aspose.PDF Cloud Java SDK 获取 PDF 文档中所有页面的表格。
使用我们的 Java 库,您可以:
- 以文本或图像格式添加 PDF 文档的页眉和页脚。
- 向 PDF 文档添加表格和印章(文本或图像)。
- 将多个 PDF 文档附加到现有文件中。
- 处理 PDF 附件、批注和表单字段。
- 对 PDF 文档进行加密或解密并设置密码。
- 删除页面或整个 PDF 文档中的所有印章和表格。
- 按 ID 删除 PDF 文档中的特定印章或表格。
- 替换 PDF 页面或整个文档中的单个或多个文本实例。
- 提供广泛的 PDF 文档转换为多种其他文件格式的支持。
- 提取 PDF 文件的各种元素并优化 PDF 文档。
- 您可以试用我们的 免费应用 在线提取 PDF 文件中的表格并测试功能。