您当前的位置: 首页 > 慢生活 > 程序人生 网站首页程序人生
python转pdf为html
发布时间:2024-07-08 21:47:50编辑:雪饮阅读()
-
python转pdf为html,转当然是可以转,但是如果你的要求比较高,可能就未必能满足了。
命令
D:\softwareInstall\python373\python.exe -m pip install Spire.PDF
D:\softwareInstall\python373\python.exe D:\softwareInstall\python373\pdfConvertToHtml.py
这里的命令第一个就是要安装的依赖,第二个就是运行我们编写的python脚本,那么我们编写的python脚本如下:
pdfConvertToHtml.py:
from spire.pdf.common import *
from spire.pdf import *
from datetime import datetime
# 创建一个PdfDocument类的对象
doc = PdfDocument()
inputpath = "D:/softwareInstall/python373/pdf/Testing - ND2B_fillable - new form .pdf"
# 加载一个PDF文档
doc.LoadFromFile(inputpath)
outputpath="D:/softwareInstall/python373/output/";
# 将文档转换为HTML
now = datetime.now()
formatted_time = now.strftime("%Y_%m_%d_%H_%M_%S")
file_name = f"{formatted_time}.html"
full_file_path = f"{outputpath}{file_name}"
# 禁用SVG嵌入
doc.ConvertOptions.SetPdfToHtmlOptions(False)
doc.SaveToFile(full_file_path, FileFormat.HTML)
doc.Close()

顺便说下禁用svg是防止整个转出的html大多是由svg图片组成,不利于编辑,但是即便这样,我发现该是input元素的地方,却仍旧svg...
关键字词:python,pdf转html