python爬虫(1)-helloworld

2017-11-27  本文已影响10人  初灬终

环境:python3.6
工具:PyCharm
目标:爬取一个HTML页面(先不考虑JavaScript,CSS等)

import requests

req = requests.get('http://chuanyuezhe.yetianzi.com')
#解决编码问题
req.encoding = 'utf-8'
file = open('/tmp/xiaoshuo.html', 'w')
file.write(req.text)
file.close()
上一篇下一篇

猜你喜欢

热点阅读