Python: Pdf2Docx
Tadi malam saya ingin mengirimkan dokumen yang harusnya dikirim dalam bentuk docx, namun file yang dikirim ke saya ada yang berbentuk docx ada yang pdf.
Males juga mengubah secara manual dari pdf ke docx. Apalagi jumlahnya mungkin sekitar 20-an file.
Ok, kita selesaikan dengan Python:
pip install Converter
pip install pdf2docx
Kemudian gunakan skrips eperti ini:
# install dulu librarynya: # pip install Converter # pip install pdf2docx from pdf2docx import Converter import os ### dir_path for input reading and output files & a for loop ### path_input = './cay-pdf/' path_output = './cay-output/' # Pastikan folder output ada, jika tidak buat os.makedirs(path_output, exist_ok=True) # Loop melalui semua file di folder input for file in os.listdir(path_input): # Filter hanya file PDF if file.lower().endswith('.pdf'): # Dapatkan nama file tanpa ekstensi file_name = os.path.splitext(file)[0] # Path lengkap untuk input dan output input_path = os.path.join(path_input, file) output_path = os.path.join(path_output, file_name + '.docx') # Konversi file try: cv = Converter(input_path) cv.convert(output_path, start=0, end=None) cv.close() print(f"Berhasil mengonversi: {file}") except Exception as e: print(f"Error saat mengonversi {file}: {e}")
Terus hasilnya bagaimana. Ya, lumayanlah …