python-PPTXpython自动化

Python自动化办公|两秒完成250页豆瓣电影PPT最终效果展

2020-02-12  本文已影响0人  叫我老村长

PPT并不好用, 但还是得用它, 这里借用豆瓣Top250的电影信息, 利用python-pptx (0.6.7)自动生成250张PPT, 希望通过实例, 给常年整理PPT报表的上班族, 一个解放生产力的新思路

image

最终效果展示

image

数据哪里来的?

爬虫抓的!

不懂爬虫怎么办?

看之前爬虫教程

自动化制作PPT 的 一二三

先制作PPT模板

image image

制作模板的过程, 就是插入占位符的过程, 可以根据自己的需求插入各种占位符, 比如,豆瓣电影Top250的需求是, 插入图片和文本内容, 那就从占位符中选择, 内容, 图片, 插入模板就好, 然后再对模板中的内容样式和图片位置进行调整, 就能得到符合需求的模板了

image

准备数据:

我直接把原来写过的,python爬取豆瓣电影的脚本, 运行了一遍, 图片和文本数据就都齐了《进击的虫师》爬取豆瓣电影海报(Top250)

image

Python编程(将数据按照模板填空, 导出到最终的ppt中)

源码如下(注释详尽):

from pptx import Presentation
from pptx.util import Inches

获取豆瓣电影信息

def getInfo():
movies_info = []

with open('./douban_movie_top250.txt') as f:
    for line in f.readlines():
        line_list = line.split("\'")
        one_movie_info = {}
        one_movie_info['index'] = line_list[1]
        one_movie_info['title'] = line_list[3]
        one_movie_info['score'] = line_list[5]

        try:
            one_movie_info['desc'] = line_list[7]
        except:
            one_movie_info['desc'] = ''

        one_movie_info['image_path'] = "./Top250_movie_images/"+ str(line_list[1]) + '_' + line_list[3] + ".jpg"

        movies_info.append(one_movie_info)

return movies_info

创建ppt

def createPpt(movies_info):
    prs = Presentation('model.pptx')
    for movie_info in movies_info:
        # 获取模板个数
        templateStyleNum = len(prs.slide_layouts)
        # 按照第一个模板创建 一张幻灯片
        oneSlide = prs.slides.add_slide(prs.slide_layouts[0])
        # 获取模板可填充的所有位置
        body_shapes = oneSlide.shapes.placeholders
        for index, body_shape in enumerate(body_shapes):
            if index == 0:
                body_shape.text = movie_info['index']+movie_info['title']
            elif index == 1:
                img_path = movie_info['image_path']
                body_shape.insert_picture(img_path)
            elif index == 2:
                body_shape.text = movie_info['desc']
            elif index == 3:
                body_shape.text = movie_info['score']
    # 对ppt的修改  
    prs.save('豆瓣Top250推荐.pptx')

def main():
    # 获取豆瓣电影信息
    movies_info = getInfo()
    createPpt(movies_info)

if __name__ == '__main__':
    main()</pre>

Python生成图表(豆瓣电影Top20的评分为例)

image
# encoding: utf-8
from pptx import Presentation
from pptx.chart.data import ChartData
from pptx.enum.chart import XL_CHART_TYPE
from pptx.util import Inches

# 创建幻灯片
prs = Presentation()
slide = prs.slides.add_slide(prs.slide_layouts[6])

# 定义图表数据
chart_data = ChartData()
chart_data.categories = ['肖申克的救赎', '霸王别姬', '这个杀手不太冷', '阿甘正传', '美丽人生', '千与千寻', '泰坦尼克号', '辛德勒的名单', '盗梦空间', '机器人总动员', '海上钢琴师', '三傻大闹宝莱坞', '忠犬八公的故事', '放牛班的春天', '大话西游之大圣娶亲', '楚门的世界', '教父', '龙猫', '熔炉', '乱世佳人']
chart_data.add_series('豆瓣电影', (9.6, 9.5, 9.4, 9.4, 9.5, 9.2, 9.2, 9.4, 9.3, 9.3, 9.2, 9.2, 9.2, 9.2, 9.2, 9.1, 9.2, 9.1, 9.2, 9.2))
# 将图表添加到幻灯片
x, y, cx, cy = Inches(0), Inches(0), Inches(10), Inches(8)
slide.shapes.add_chart(XL_CHART_TYPE.COLUMN_CLUSTERED, x, y, cx, cy, chart_data)
prs.save('豆瓣 Top20 评分图.pptx')</pre>

关于数据图形化: Python有很多优秀的图形库, 比如matplotlab, 以及Google推出的在线编程工具colabratory, 都可以方便的实现数据可视化, 掌握了Python图形库的使用, 基本可以和PPT图表说拜拜了...

image
上一篇下一篇

猜你喜欢

热点阅读