python将html页面转换为word文档
使用前:需先下载pandoc插件。pandoc
import pypandoc# -*- coding:utf-8 -*-import pypandoc# html文档的位置html_path = r"ceshi_to_word.html"# 转换生成word文档的位置word_path = r"ceshi_to_word.docx"pypandoc.convert_file(html_path, 'docx', outputfile=word_path)
这个还行,只是转换出来的word文档没有html上面的格式。
注意:上面的html文档为静态文档,文档中的静态文件:图片等文件存储在和html页面同名的文件下,且他俩在同一级目录下,否则找不到路径,如下图所示。并且输出路径:outputfile是一个已存在的路径,不能包含未创建的文件夹名,即 convert_file方法不能新建文件夹。