1 python-docx简介

python-docx库可以用来创建、读取、编辑.docx格式的文件。

官方文档

2 安装

可通过以下方式安装:

  • Pip:
pip install python-docx

3 示例

3.1 创建docx文件

创建一个简单的docx文件,里面写了Hello World

from docx import Document
 
document = Document()
head1 = document.add_heading('1 HelloWorld')
paragraph = document.add_paragraph('Yes Hello World!')
 
document.save('demo.docx')

效果:

3.2 读取docx文件

我们读取一下刚才写好的文件:

from docx import Document
 
document = Document("demo.docx")
paragraphs = document.paragraphs
for paragraph in paragraphs:
    print(paragraph.text)

输出:

1 HelloWorld
Yes Hello World!

3.3 编辑docx文件

我们在原来文件的基础上进行修改,并另存为一个新文件:

  • 1改成2
  • Yes改成No
from docx import Document
import re
 
document = Document("demo.docx")
paragraphs = document.paragraphs
 
paragraphs[0].text = re.sub('1', '2', paragraphs[0].text)  # 将1替换成2
paragraphs[1].text = re.sub('Yes', 'No', paragraphs[1].text)  # 将Yes替换成No
 
for paragraph in paragraphs:
    print(paragraph.text)
 
document.save("demo_new.docx")

import re

re库是一个正则表达式库,见re-正则表达式库

效果:

2 HelloWorld
No Hello World!

3.4 基于模板生成报表

基于python-docx和模板制作报告