Python: Pdf2Docx

Tadi malam saya ingin mengirimkan dokumen yang harusnya dikirim dalam bentuk docx, namun file yang dikirim ke saya ada yang berbentuk docx ada yang pdf.

Males juga mengubah secara manual dari pdf ke docx. Apalagi jumlahnya mungkin sekitar 20-an file.

Ok, kita selesaikan dengan Python:

pip install Converter
pip install pdf2docx

Kemudian gunakan skrips eperti ini:

# install dulu librarynya:
# pip install Converter
# pip install pdf2docx

from pdf2docx import Converter
import os

### dir_path for input reading and output files & a for loop ###

path_input = './cay-pdf/'
path_output = './cay-output/'

# Pastikan folder output ada, jika tidak buat
os.makedirs(path_output, exist_ok=True)

# Loop melalui semua file di folder input
for file in os.listdir(path_input):
    # Filter hanya file PDF
    if file.lower().endswith('.pdf'):
        # Dapatkan nama file tanpa ekstensi
        file_name = os.path.splitext(file)[0]

        # Path lengkap untuk input dan output
        input_path = os.path.join(path_input, file)
        output_path = os.path.join(path_output, file_name + '.docx')

        # Konversi file
        try:
            cv = Converter(input_path)
            cv.convert(output_path, start=0, end=None)
            cv.close()
            print(f"Berhasil mengonversi: {file}")
        except Exception as e:
            print(f"Error saat mengonversi {file}: {e}")

Terus hasilnya bagaimana. Ya, lumayanlah …