Tuesday, August 16, 2022

Konversi File Pdf ke Word dengan Menggunakan Python


Dengan menggunakan bahasa Python kita bisa melakukan konversi dokumen pdf menjadi dokumen word dengan menggunakan library pdf2docx. 

Berikut cara membuat file file dokumen docx dari hasil konversi file format pdf. Dalam contoh ini saya gunakan notebook dari Kaggle. Silahkan buka web Kaggle kemudian buat notebook baru dengan cara klik menu < >Code disebelah kiri lalu klik New Notebook dan tuliskan kode perintah dalam cell sebagai berikut:


from pdf2docx import Converter

pdf_file = '../input/file pdf.pdf'

docx_file = './test.docx'

cv = Converter(pdf_file)

cv.convert(docx_file)

cv.close()


Kemudian Run current cell atau tekan Ctrl + Enter dan tunggu proses sampai konversi selesai dilakukan. Jika berhasil maka akan dibuat satu file test.docx di Data pada folder Output/Working.

Jika terdapat error karena package pdf2docx belum terinstall maka lakukan instalasi package pdf2docx dengan menggunakan perintah:


!pip install pdf2docx


Dengan catatan kita harus mengaktifkan atau enable Internet di bagian Settings di menu sebelah kanan.  

Oke cukup simpel kan bagaimana konversi file pdf ke docx dengan menggunakan library/package pdf2docx di Python.

Terima kasih sudah menyimak semoga bermanfaat. @wawanhn


Referensi:

https://www.clcoding.com/2022/08/day-83-convert-pdf-to-docx-using-python.html



Previous Post
Next Post

0 comments: