模块准备
首先安装spire.doc这个库,win+r,键入cmd,输入此代码,待安装完成
pip install spire.doc


将要导出的word

word中有如下图片,我要将其进行导出,
代码准备
import queue
from spire.doc import *
from spire.doc.common import *
import os
# 指定输入文件路径
input_file = "d:/400-file/000-project/000-pycharm/005-microsoftword/000-extract-photo from word/photo.docx"
# 指定输出目录路径
output_path = "d:/400-file/000-project/000-pycharm/005-microsoftword/000-extract-photo from word/photo"
# 如果输出目录不存在,则创建
os.makedirs(output_path, exist_ok=true)
# 创建一个document实例
document = document()
# 加载输入的word文档
document.loadfromfile(input_file)
# 创建一个列表来存储提取的图片数据
images = []
# 初始化一个队列来存储待遍历的文档元素
nodes = queue.queue()
nodes.put(document)
# 遍历文档元素
while not nodes.empty():
node = nodes.get()
for i in range(node.childobjects.count):
obj = node.childobjects[i]
# 查找图片
if isinstance(obj, docpicture):
picture = obj
# 将图片数据添加到列表中
data_bytes = picture.imagebytes
images.append(data_bytes)
elif isinstance(obj, icompositeobject):
nodes.put(obj)
# 将图片数据保存为图像文件
for i, image_data in enumerate(images):
file_name = f"image-{i}.png"
with open(os.path.join(output_path, file_name), 'wb') as image_file:
image_file.write(image_data)
document.close()
这里是可供执行的代码文件
可供修改的位置

需要修改的位置只有这两处 ,注意复制的路径可能是这样的
"d:\400-file\000-project\000-pycharm\005-microsoftword\000-extract-photo from word\photo.docx"
要将其改写为这样。”\“替换为”/“
"d:/400-file/000-project/000-pycharm/005-microsoftword/000-extract-photo from word/photo.docx"
运行结果


到此这篇关于使用python将word中的图片进行导出功能的文章就介绍到这了,更多相关python word图片导出内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论