Parse PDF untuk Ekstraksi Teks dalam Java SDK
API untuk memparsing dokumen PDF untuk mengekstrak teks menggunakan API Java sisi server.
Get StartedCara memparsing dokumen PDF untuk ekstraksi Teks menggunakan Cloud Java SDK
Untuk memparsing dokumen PDF ke ekstraksi Teks melalui Cloud Java SDK, kita akan menggunakan Aspose.PDF Cloud Java SDK SDK Java Cloud ini memungkinkan Anda dengan mudah membangun aplikasi pembuat, editor, & konverter PDF berbasis cloud dalam bahasa Java untuk berbagai platform cloud. Buka Repository pengelola paket, cari Aspose.PDF Cloud dan instal. Anda juga dapat menggunakan perintah berikut dari Package Manager Console untuk menginstalnya menggunakan Maven.
Tambahkan repositori Aspose Cloud ke pom.xml aplikasi Anda
Tambahkan repositori Aspose Cloud
<repositories>
<repository>
<id>aspose-cloud</id>
<name>Aspose Cloud Repository</name>
<url>https://releases.aspose.cloud/java/repo/</url>
</repository>
</repositories>
Untuk menginstal pustaka klien API ke repositori Maven lokal Anda, cukup jalankan:
Instalasi dari Github
mvn clean install
Untuk menyebarkannya ke repositori Maven remote, konfigurasikan pengaturan repositori dan jalankan:
Sebarkan repositori Maven
mvn clean deploy
Langkah-langkah untuk memparsing PDF untuk ekstraksi Teks menggunakan Java SDK
Pengembang Aspose.PDF Cloud dapat dengan mudah memparsing dokumen PDF untuk ekstraksi Teks. Pengembang hanya membutuhkan beberapa baris kode.
- Buat objek Configuration baru dengan Application Secret dan Key Anda
- Buat objek untuk terhubung ke Cloud API
- Unggah file dokumen Anda
- Parse dokumen PDF untuk ekstraksi Teks di penyimpanan cloud menggunakan fungsi getDocumentTextBoxFields
- Periksa respons dan catat hasilnya
- Jika operasi berhasil, cetak teks yang diekstrak
Kode contoh ini menunjukkan parsing dokumen PDF untuk ekstraksi Teks
import java.io.File;
import java.nio.file.Files;
import java.nio.file.OpenOption;
import java.nio.file.StandardOpenOption;
import java.nio.file.Path;
import com.google.gson.Gson;
import com.aspose.asposecloudpdf.api.PdfApi;
import com.aspose.asposecloudpdf.model.TextBoxField;
import com.aspose.asposecloudpdf.model.TextBoxFieldsResponse;
public class ParseGetTextBoxes {
public static void extract() {
String REMOTE_FOLDER = "Your_Temp_Pdf_Cloud";
String LOCAL_FOLDER = "c:\\Samples";
String PDF_DOCUMENT = "sample.pdf";
String OUTPUT_FILE = "parsed_text_box_fields_output.json";
try {
PdfApi pdfApi = new PdfApi(API_KEY, API_SECRET);
// upload local PDF file to remote storage
File file = new File(Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString());
pdfApi.uploadFile(Path.of(REMOTE_FOLDER , PDF_DOCUMENT).toString(), file, null);
System.out.println(String.format("File '%s' successfully uploaded!", Path.of(LOCAL_FOLDER, PDF_DOCUMENT).toString()));
// perform action
TextBoxFieldsResponse response = pdfApi.getDocumentTextBoxFields(PDF_DOCUMENT, null, REMOTE_FOLDER);
System.out.println("TextBox fields extracted status: " + response.getStatus());
String jsonResult = "[\n";
for (TextBoxField fieldDef : response.getFields().getList()) {
String jsonFiled = new Gson().toJson(fieldDef);
jsonResult += jsonFiled + ",\n\n";
}
jsonResult +="]";
// save json
Path path = Path.of(LOCAL_FOLDER, OUTPUT_FILE);
byte[] strToBytes = jsonResult.getBytes();
Files.write(path, strToBytes, new OpenOption[] { StandardOpenOption.WRITE, StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING });
System.out.println("TextBox fields successfully extracted to: '" + path + "'");
} catch (Exception e) {
e.printStackTrace();
}
}
}
Bekerja dengan parsing Teks dalam PDF melalui Java SDK
Dengan memparsing dokumen PDF untuk ekstraksi teks, Anda dapat memodifikasi konten bidang TextBox sesuai kebutuhan. Ini mempertahankan posisi teks dalam dokumen sambil menghemat waktu dan mengurangi pekerjaan manual. Parse dokumen PDF untuk ekstraksi teks dengan Aspose.PDF Cloud Java SDK.
Dengan Java SDK kami, Anda dapat
- Tambahkan header & footer dokumen PDF dalam format teks atau gambar.
- Tambahkan tabel & teks atau stempel gambar ke dokumen PDF.
- Gabungkan beberapa dokumen PDF ke file yang sudah ada.
- Bekerja dengan lampiran PDF, anotasi, & bidang formulir.
- Terapkan enkripsi atau dekripsi pada dokumen PDF & atur kata sandi.
- Hapus semua stempel & tabel dari halaman atau seluruh dokumen PDF.
- Hapus stempel atau tabel tertentu dari dokumen PDF berdasarkan ID-nya.
- Ganti satu atau beberapa contoh teks pada halaman PDF atau dari seluruh dokumen.
- Dukungan luas untuk mengonversi dokumen PDF ke berbagai format file lainnya.
- Ekstrak berbagai elemen file PDF & buat dokumen PDF yang dioptimalkan.
- Anda dapat mencoba Aplikasi gratis kami untuk menguji fungsionalitas.
- Sumber Daya Pembelajaran
- Dokumentasi
- Kode Sumber
- Referensi API
- Dukungan Produk
- Dukungan Gratis
- Dukungan Berbayar
- Blog
- Mengapa Aspose.PDF Cloud untuk Java?
- Daftar Pelanggan
- Keamanan