合同PDF有很多页,需要提取首页和尾页(盖章页),并转成图片,以便检查有无未盖章的合同,借用了几位网友的代码,重构了一下。
转图片须先安装poppler:
并将...poppler-23.07.0\Library\bin 放入系统环境变量的PATH中
import os
from PyPDF2 import PdfReader, PdfWriter
from pdf2image import convert_from_path
src_dir = "D:\\files\\bk\\src_pdf\\"
out_dir = "D:\\files\\bk\\output_pdf\\"
pic_dir = "D:\\files\\bk\\output_pic\\"
def list_all_file_names(root_dir):
file_name_dict = []
files = os.listdir(root_dir)
for i in range(0, len(files)):
file_name = os.path.join(files[i])
file_name_dict.append(file_name)
return file_name_dict
def extract_first_and_l