Python爬虫实战1

2022-03-10  本文已影响0人  python小哥哥2020

** 小福利,爬取喜欢歌手歌曲的歌词,话不多说上代码 **

import requests
url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp'
# 这是请求歌曲评论的url
choice=input('请输入你喜欢的歌手:')
headers = {
    'origin':'https://y.qq.com',
    # 请求来源,本案例中其实是不需要加这个参数的,只是为了演示
    'referer':'https://y.qq.com/n/yqq/song/004Z8Ihr0JIu5s.html',
    # 请求来源,携带的信息比“origin”更丰富,本案例中其实是不需要加这个参数的,只是为了演示
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',
    # 标记了请求从什么设备,什么浏览器上发出
    }
params = {
'ct':'24',
'qqmusic_ver': '1298',
'remoteplace': 'txt.yqq.lyric',
'searchid': '105357871429576378',
'aggr': '0',
'catZhida': '1',
'lossless': '0',
'sem': '1',
't':'7',
'p': 'i',
'n': '5',
'w': choice,
'g_tk_new_20200303': '5381',
'g_tk': '5381',
'loginUin': '0',
'hostUin': '0',
'format': 'json',
'inCharset': 'utf8',
'outCharset': 'utf-8',
'notice': '0',
'platform': 'yqq.json',
'needNewCode': '0'
}


for i in range(1,6):
    res_music = requests.get(url,headers=headers,params=params)
    json_comments = res_music.json()
    # 使用json()方法,将response对象,转为列表/字典
    list_comments = json_comments['data']['lyric']['list']
    # 一层一层地取字典,获取评论列表
    for lyric in list_comments:
    # list_comments是一个列表,comment是它里面的元素
        print(lyric['content'])
        # 输出评论
        print('-----------------------------------')
    # 将不同的评论分隔开来


上一篇下一篇

猜你喜欢

热点阅读