Python数据采集与爬虫Python爬虫作业大数据 爬虫Python AI Sql

Python 制作语音天气预报播报程序

2017-07-15  本文已影响576人  高杆python

之前在参加Python爬虫小分队的学习时,爬取过中国天气网这个网站,可以通过爬虫获取当地的天气信息,今天和大家分享一个将爬虫得到的天气文本信息通过百度语音合成接口制作成语音文件,并进行语音播报。

百度语音.png
1.编程思路:
(1)通过Python爬虫,爬取中国天气网的天气数据。
(2)使用百度语音API将天气文本数据转换成语音文件。
(3)利用Python的os库,自动播报语音文件。
2.示例代码:
import urllib.request
import json
import base64
import requests
from bs4 import BeautifulSoup
import datetime
import os
import time
class BaiduRest:
    def __init__(self, cu_id, api_key, api_secert):
        self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
        self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
        self.upvoice_url = 'http://vop.baidu.com/server_api'
        self.cu_id = cu_id
        self.getToken(api_key, api_secert)
        return
    def getToken(self, api_key, api_secert):
        token_url = self.token_url % (api_key,api_secert)
        r_str = urllib.request.urlopen(token_url).read()
        token_data = json.loads(r_str)
        self.token_str = token_data['access_token']
        pass
    def getVoice(self, text, filename):
        get_url = self.getvoice_url % (urllib.parse.quote(text), self.cu_id, self.token_str)
        voice_data = urllib.request.urlopen(get_url).read()
        voice_fp = open(filename,'wb+')
        voice_fp.write(voice_data)
        voice_fp.close()
        pass
if __name__ == "__main__":
    url = 'http://www.weather.com.cn/weather1d/101060201.shtml'
    headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
    }
    html = requests.get(url,headers).content
    soup = BeautifulSoup(html,'lxml')
    weather_day = soup.select('div.t > ul > li > p.wea')[0].text
    weather_night = soup.select('div.t > ul > li > p.wea')[1].text
    tmp_day = soup.select('div.t > ul > li > p.tem > span')[0].text
    tmp_night = soup.select('div.t > ul > li > p.tem > span')[1].text
    wind_day = soup.select('div.t > ul > li > p.win > span')[0].text
    wind_night = soup.select('div.t > ul > li > p.win > span')[1].text
    uv_index = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li1.hot > span')[0].text #紫外线指数
    ganmao_index = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li2.hot > span')[0].text
    gaomao_detail = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li2.hot > p')[0].text
    dress_index = soup.select('li#chuanyi > a > span')[0].text     #穿衣指数
    dress_detail = soup.select('li#chuanyi > a > p')[0].text
    carwash_index = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li4.hot > span')[0].text    #洗车指数
    carwash_detail = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li4.hot > p')[0].text
    play_index = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li5.hot > span')[0].text       #运动指数
    play_detail = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li5.hot > p')[0].text
    air_index = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li6.hot > span')[0].text
    air_detail = soup.select('div.con.today.clearfix > div.left.fl > div.livezs > ul > li.li6.hot > p')[0].text
    now_date = datetime.datetime.now().strftime('%Y-%m-%d %A')
    weather_txt = "早上好,今天是%s,白天%s,%s,最高温度%s摄氏度,夜间%s,%s,最低温度%s摄氏度,今日紫外线指数,%s,感冒指数,%s,%s"\
            "穿衣指数,%s,%s,洗车指数,%s,%s运动指数,%s,%s空气污染扩散指数,%s,%s"%(now_date,weather_day,wind_day,tmp_day,\
            weather_night,wind_day,tmp_night,uv_index,ganmao_index,gaomao_detail,dress_index,dress_detail,\
            carwash_index,carwash_detail,play_index,play_detail,air_index,air_detail)
    api_key = "ePD9WYpVqLTFiNS6xuGNNecx" 
    api_secert = "0690da30377c41778d6f6bf98a6d68b6"
    bdr = BaiduRest("test_python", api_key, api_secert)
    bdr.getVoice(weather_txt, "today_weather.mp3")
    os.system("today_weather.mp3")
    time.sleep(60)
    os.system("taskkill /F /IM wmplayer.exe")

3.代码解析:
上边的代码只要分文两部分,第一部分是通过Python的requests库,beautifulsoup库实现对中国天气网的当地天气数据进行爬取,再将爬取后的数据形成一对字符串文本weather_txt。之后第二部分就是调用程序中定义的通过百度语音接口,制作语音文件的类class BaiduRest,通过类中的getVoice方法利用之前生成的weather_txt文本转换生成today_weather.mp3音频文件,之后通过os.sysem("today_weather.mp3")将音频文件进行播放,设定播放的时间为60秒,之后通过os.system("taskkill /F /IM wmplayer.exe")关闭语音播报的程序软件。

4.特别说明:
这里需要申请使用百度语音的api接口,具体的申请网址是:http://yuyin.baidu.com/
申请的方法比较简单,在这就不做介绍了,申请成功后就会得到类似代码中api_key = "ePD9WYpVqLTFiNS6xuGNNecx" ,api_secert = "0690da30377c41778d6f6bf98a6d68b6"的秘钥,将它替换到程序中,值得注意的是每天调用合成语音的api是存在次数限制的。

如果你不嫌烦可以将这段代码通过pyinstaller打包成EXE程序,并将程序设置成开机启动项,这样每当开启电脑后,就会自动播报一下当地的天气情况。也可以部署到树莓派上,设置定点执行,使用语音播报天气预报的小功能。

上一篇 下一篇

猜你喜欢

热点阅读