Python 自动化:python-pptx 批量生成幻灯片

同步 CSDN 博文

Posted by Newyee on April 5, 2020

需求分析

最近遇到了制作 PPT 报告的任务,前期收集整理后的表格数据长这样: Excel 数据 随后要基于上述数据制作 PPT 报告,几十页的幻灯片都是下图的格式:幻灯片示例1

Well, my coding fingers got quite itchy.

这种繁琐的手动制作幻灯片还是交给 Python 来自动完成吧!Python 中已有第三方库很好地支持 PowerPoint !

python-pptx 介绍

python-pptx是用于创建和更新 PowerPoint(.pptx)文件的 Python 库。

用途大致如下:

  • 典型的是从数据库内容生成自定义的可用于演示的工程状态报告,可通过单击 Web 应用程序中的链接下载该演示文稿。
  • 用于对演示文稿库进行批量更新。
  • 自动化制作对于人工操作繁琐的幻灯片。

由于开发团队的辛勤维护,目前已具有以下功能

  1. 打开、读取、创建、保存演示文稿(.pptx文件)
  2. 添加幻灯片
  3. 填充文本占位符,例如创建项目符号幻灯片
  4. 添加图像并调整位置和尺寸
  5. 添加文本框并调整文本的字体、大小和粗体
  6. 添加表格
  7. 添加形状,如多边形、流程图形状等
  8. 添加图表,如柱形图、条形图、折线图和饼图等
  9. 访问和修改元素属性,例如标题、主题等
  10. ……(更多功能开发ing)

python-pptx 安装

python-pptx 托管在 PyPI 上,可以很方便地用 pip 安装:

1
pip install python-pptx
  • 支持 Python 2.6, 2.7, 3.3, 3.4, 3.6(测试 3.7 能正常安装和简单使用,是否会有使用异常尚未知)本文代码运行环境为 Python 3.6。
  • 依赖库会自动安装:lxml、Pillow、XlsxWriter

Hello World! 示例

成功安装后,运行以下示例代码,体验一下效果:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 导包
from pptx import Presentation

# 创建空白演示文稿
prs = Presentation()
# 添加标题布局的幻灯片
title_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(title_slide_layout)
# 设置标题和副标题
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "Hello, World!"
subtitle.text = "python-pptx was here!"
# 保存
prs.save('test.pptx')

Hello World 更多用例请移步Getting Started1

后面有空我也会整理一下学习 python-pptx 的代码笔记

需求实现

有了 python-pptx 的加持,要实现文章一开始的需求就容易多了,简单分为以下几步:

  1. 读取 Excel 数据(并预处理)—— 本例使用 pandas库读取 news.xlsx文件
  2. 创建空白演示文稿(并添加封面幻灯片)
  3. 依据数据循环添加幻灯片并设置文本格式(这一步是重点也是难点,详细说明参考代码注释)
  4. 保存演示文稿
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
# !/usr/bin/env python
# -*- coding: utf-8 -*-

from pptx import Presentation
from pptx.util import Pt
from pptx.enum.text import MSO_AUTO_SIZE
import pandas as pd


class WritePowerPoint:
    def __init__(self, ppt_name, input_excel, title_cover, subtitle):
        self.ppt_name = ppt_name
        self.input_excel = input_excel
        self.title_cover = self.title_per_page = title_cover
        self.subtitle_cover = subtitle
        # 创建空白演示文稿
        self.prs = Presentation()

    def add_cover(self):
        # 添加封面布局幻灯片
        slide_layout_cover = self.prs.slide_layouts[0]
        slide = self.prs.slides.add_slide(slide_layout_cover)
        # 设置标题和副标题
        title = slide.shapes.title
        subtitle = slide.placeholders[1]
        title.text = self.title_cover
        subtitle.text = self.subtitle_cover

    def add_slide(self, line2_texts):
        # 添加布局5幻灯片
        slide_layout = self.prs.slide_layouts[5]
        slide = self.prs.slides.add_slide(slide_layout)
        shapes = slide.shapes
        # 设置标题:内容、位置、字体、大小等格式
        title_shape = shapes.title
        title_shape.text = self.title_per_page
        title_shape.left, title_shape.top = Pt(32), Pt(22)
        title_shape.width, title_shape.height = Pt(660), Pt(50)
        tf0 = title_shape.text_frame
        p0 = tf0.paragraphs[0]
        p0.font.name = '微软雅黑'
        p0.font.size = Pt(24)
        # 添加文本框
        left, top, width, height = Pt(32), Pt(82), Pt(665), Pt(396)
        text_box = slide.shapes.add_textbox(left, top, width, height)
        tf = text_box.text_frame
        # 自动换行
        tf.word_wrap = True
        # 自动调整大小以适应文本
        tf.auto_size = MSO_AUTO_SIZE.SHAPE_TO_FIT_TEXT

        def add_paragraph_texts(texts):
            print(texts[0])
            for i, text in enumerate(texts[:-1]):       # 最后的网址作为超链接
                p = tf.add_paragraph()
                p.text = text
                if i == len(texts) - 2:
                    run = p.add_run()
                    run.text = '查看更多'
                    run.hyperlink.address = texts[-1]   # 写入超链接
                    tf.add_paragraph()

        # 在文本框中添加内容
        for lst in line2_texts:
            add_paragraph_texts(lst)

    def run(self):
        # 读取 Excel 数据并进行预处理
        df = pd.read_excel(self.input_excel)
        df['发布机构'] = '发布机构:' + df['发布机构']
        df['发布时间'] = '发布时间:' + df['发布时间']
        df['关键词'] = '关键词:' + df['关键词']

        # 添加封面幻灯片
        self.add_cover()
        # 添加重复格式的幻灯片,每页写 2 条数据
        for i in df.index[::2]:
            self.add_slide([df.loc[i, :].tolist(), df.loc[i+1, :].tolist()])

        # 保存
        self.prs.save(self.ppt_name)


if __name__ == '__main__':
    wpt = WritePowerPoint('news.pptx', 'news.xlsx', 'News Briefs', '2020/4/5')
    wpt.run()

代码运行后便可得到若干页的 news.pptx运行结果1 运行结果2

代码中还可以加入更多的文本格式设置代码,美化幻灯片:幻灯片示例2