需求分析
最近遇到了制作 PPT 报告的任务,前期收集整理后的表格数据长这样: 随后要基于上述数据制作 PPT 报告,几十页的幻灯片都是下图的格式:
Well, my coding fingers got quite itchy.
这种繁琐的手动制作幻灯片还是交给 Python 来自动完成吧!Python 中已有第三方库很好地支持 PowerPoint !
python-pptx 介绍
python-pptx
是用于创建和更新 PowerPoint(.pptx)文件的 Python 库。
其用途大致如下:
- 典型的是从数据库内容生成自定义的可用于演示的工程状态报告,可通过单击 Web 应用程序中的链接下载该演示文稿。
- 用于对演示文稿库进行批量更新。
- 自动化制作对于人工操作繁琐的幻灯片。
由于开发团队的辛勤维护,目前已具有以下功能:
- 打开、读取、创建、保存演示文稿(.pptx文件)
- 添加幻灯片
- 填充文本占位符,例如创建项目符号幻灯片
- 添加图像并调整位置和尺寸
- 添加文本框并调整文本的字体、大小和粗体
- 添加表格
- 添加形状,如多边形、流程图形状等
- 添加图表,如柱形图、条形图、折线图和饼图等
- 访问和修改元素属性,例如标题、主题等
- ……(更多功能开发ing)
python-pptx 安装
python-pptx 托管在 PyPI 上,可以很方便地用 pip 安装:
1
pip install python-pptx
- 支持 Python 2.6, 2.7, 3.3, 3.4, 3.6(测试 3.7 能正常安装和简单使用,是否会有使用异常尚未知)本文代码运行环境为 Python 3.6。
- 依赖库会自动安装:lxml、Pillow、XlsxWriter
Hello World! 示例
成功安装后,运行以下示例代码,体验一下效果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 导包
from pptx import Presentation
# 创建空白演示文稿
prs = Presentation()
# 添加标题布局的幻灯片
title_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(title_slide_layout)
# 设置标题和副标题
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "Hello, World!"
subtitle.text = "python-pptx was here!"
# 保存
prs.save('test.pptx')
更多用例请移步Getting Started1
后面有空我也会整理一下学习 python-pptx 的代码笔记
需求实现
有了 python-pptx 的加持,要实现文章一开始的需求就容易多了,简单分为以下几步:
- 读取 Excel 数据(并预处理)—— 本例使用
pandas
库读取news.xlsx
文件 - 创建空白演示文稿(并添加封面幻灯片)
- 依据数据循环添加幻灯片并设置文本格式(这一步是重点也是难点,详细说明参考代码注释)
- 保存演示文稿
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
# !/usr/bin/env python
# -*- coding: utf-8 -*-
from pptx import Presentation
from pptx.util import Pt
from pptx.enum.text import MSO_AUTO_SIZE
import pandas as pd
class WritePowerPoint:
def __init__(self, ppt_name, input_excel, title_cover, subtitle):
self.ppt_name = ppt_name
self.input_excel = input_excel
self.title_cover = self.title_per_page = title_cover
self.subtitle_cover = subtitle
# 创建空白演示文稿
self.prs = Presentation()
def add_cover(self):
# 添加封面布局幻灯片
slide_layout_cover = self.prs.slide_layouts[0]
slide = self.prs.slides.add_slide(slide_layout_cover)
# 设置标题和副标题
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = self.title_cover
subtitle.text = self.subtitle_cover
def add_slide(self, line2_texts):
# 添加布局5幻灯片
slide_layout = self.prs.slide_layouts[5]
slide = self.prs.slides.add_slide(slide_layout)
shapes = slide.shapes
# 设置标题:内容、位置、字体、大小等格式
title_shape = shapes.title
title_shape.text = self.title_per_page
title_shape.left, title_shape.top = Pt(32), Pt(22)
title_shape.width, title_shape.height = Pt(660), Pt(50)
tf0 = title_shape.text_frame
p0 = tf0.paragraphs[0]
p0.font.name = '微软雅黑'
p0.font.size = Pt(24)
# 添加文本框
left, top, width, height = Pt(32), Pt(82), Pt(665), Pt(396)
text_box = slide.shapes.add_textbox(left, top, width, height)
tf = text_box.text_frame
# 自动换行
tf.word_wrap = True
# 自动调整大小以适应文本
tf.auto_size = MSO_AUTO_SIZE.SHAPE_TO_FIT_TEXT
def add_paragraph_texts(texts):
print(texts[0])
for i, text in enumerate(texts[:-1]): # 最后的网址作为超链接
p = tf.add_paragraph()
p.text = text
if i == len(texts) - 2:
run = p.add_run()
run.text = '查看更多'
run.hyperlink.address = texts[-1] # 写入超链接
tf.add_paragraph()
# 在文本框中添加内容
for lst in line2_texts:
add_paragraph_texts(lst)
def run(self):
# 读取 Excel 数据并进行预处理
df = pd.read_excel(self.input_excel)
df['发布机构'] = '发布机构:' + df['发布机构']
df['发布时间'] = '发布时间:' + df['发布时间']
df['关键词'] = '关键词:' + df['关键词']
# 添加封面幻灯片
self.add_cover()
# 添加重复格式的幻灯片,每页写 2 条数据
for i in df.index[::2]:
self.add_slide([df.loc[i, :].tolist(), df.loc[i+1, :].tolist()])
# 保存
self.prs.save(self.ppt_name)
if __name__ == '__main__':
wpt = WritePowerPoint('news.pptx', 'news.xlsx', 'News Briefs', '2020/4/5')
wpt.run()
代码运行后便可得到若干页的 news.pptx
:
代码中还可以加入更多的文本格式设置代码,美化幻灯片: