哈喽,大家好,今天给大家介绍一下,Python如何读取Word文档。
1、读取文档
首先我们导入Document文档,然后写入文档的位置即可:
from docx import Document
document = Document('./这是用Python新建的文档.doc')
2、读取每个段落的文本:
通过上一步我们已经读取了文档,但是上面的方式只能够读取不能显示,因此我们需要通过for循环将每个段落展示出来:
for i in document.paragraphs:
print(i.text)
我们可以看到,每个段落就显示出来了:
3、读取文档中的表格:
我们要获取表格中的文本信息,需要这样一步步循环操作:
1)先通过for循环将表格循环出来:
for i in document.tables:
2)然后将每行读取出来:
for m in i.rows:
3)将每行中的每个单元格读取出来:
for n in m.cells:
4)我们就可以都看到每个单元格中的文本信息了:
5、新增内容
如果想要在原有文章的基础上新增内容,只需要直接打开文档后,通过新增命令增加相应内容即可:
from docx import Document
document = Document('./这是用Python新建的文档.doc')
document.add_picture('./img.png')
document.save('./这是用Python新建的文档.doc')
好了,今天的内容就先到这里了,明天见!