1 python-docx简介
python-docx
库可以用来创建、读取、编辑.docx
格式的文件。
官方文档
2 安装
可通过以下方式安装:
- Pip:
pip install python-docx
3 示例
3.1 创建docx文件
创建一个简单的docx
文件,里面写了Hello World
:
from docx import Document
document = Document()
head1 = document.add_heading('1 HelloWorld')
paragraph = document.add_paragraph('Yes Hello World!')
document.save('demo.docx')
效果:
3.2 读取docx文件
我们读取一下刚才写好的文件:
from docx import Document
document = Document("demo.docx")
paragraphs = document.paragraphs
for paragraph in paragraphs:
print(paragraph.text)
输出:
1 HelloWorld
Yes Hello World!
3.3 编辑docx文件
我们在原来文件的基础上进行修改,并另存为一个新文件:
- 将
1
改成2
- 将
Yes
改成No
from docx import Document
import re
document = Document("demo.docx")
paragraphs = document.paragraphs
paragraphs[0].text = re.sub('1', '2', paragraphs[0].text) # 将1替换成2
paragraphs[1].text = re.sub('Yes', 'No', paragraphs[1].text) # 将Yes替换成No
for paragraph in paragraphs:
print(paragraph.text)
document.save("demo_new.docx")
import re
re
库是一个正则表达式库,见re-正则表达式库
效果:
2 HelloWorld
No Hello World!