如何使用 Python 和 python-docx 库读取、写入和操作 Word 文件

前面实现了用代码修改Excel中的单元格值、字体、颜色等格式,还有一些场景需要对word进行处理 。
01 准备Python/ target=_blank class=infotextkey>Python 是一种通用编程语言,也可以用于处理 Microsoft Word 文件 。在本文中,我将向你介绍如何使用 Python 和 python-docx 库读取、写入和操作 Word 文件 。1、安装
pip install python-docx02 读写1、读取 使用 python-docx 库可以轻松读取 Word 文件 。以下代码演示了如何读取一个名为 'document.docx' 的 Word 文件并将其存储在一个名为 doc 的 python-docx 文档对象中:
import docxdoc = docx.Document('document.docx')  【如何使用 Python 和 python-docx 库读取、写入和操作 Word 文件】此代码中,首先导入 python-docx 库并将其重命名为 docx 。然后 , 使用 docx.Document() 函数读取 'document.docx' 文件并将其存储在 doc 文档对象中 。
2、写入 与读取 Word 文件类似,使用 python-docx 库也可以轻松地将数据写入 Word 文件 。以下代码演示了如何创建一个新的 Word 文件并将文本写入其中:
import docxdoc = docx.Document()doc.add_paragraph('Hello, world!')doc.save('output.docx')  使用 doc.add_paragraph() 函数将一个名为 'Hello, world!' 的段落添加到文档中 。使用 doc.save() 函数将文档保存为 'output.docx' 文件 。
03 操作1、修改文本 以下代码演示了如何使用 python-docx 修改文档中的第一个段落:
 paragraph = doc.paragraphs[0]paragraph.text = 'New text'paragraph.style = 'Heading 1'doc.save('output.docx')使用 doc.paragraphs[0] 访问文档中的第一个段落并将其存储在变量 paragraph 中 。接下来使用 paragraph.text = 'New text' 将段落文本修改为 'New text' 。使用 paragraph.style = 'Heading 1' 将段落样式修改为 'Heading 1' 。使用 doc.save() 函数将修改后的文档保存为 'output.docx' 文件 。
2、修改文本 使用 python-docx 库可以轻松地修改 Word 文档的格式
from docx import Documentfrom docx.shared import Pt# 打开文档doc = Document('example.docx')# 获取第一个段落并设置字体大小为12磅paragraph = doc.paragraphs[0]paragraph.style.font.size = Pt(12)首先导入 Document 和 Pt 类 。Document 类表示 Word 文档,Pt 类用于指定字体大小 。设置段落的字体大小为 12 磅,可以使用类似的方法来修改文档中的其他格式,例如字体颜色、字体类型和行距等 。
03 结论在本文中,介绍了如何使用 Python 和 python-docx 库读取、写入和操作 Word 文件 。




    推荐阅读