python爬虫(1)-helloworld
2017-11-27 本文已影响10人
初灬终
环境:python3.6
工具:PyCharm
目标:爬取一个HTML页面(先不考虑JavaScript,CSS等)
import requests
req = requests.get('http://chuanyuezhe.yetianzi.com')
#解决编码问题
req.encoding = 'utf-8'
file = open('/tmp/xiaoshuo.html', 'w')
file.write(req.text)
file.close()