「爬虫」07爬取新浪网首页新闻
2020-01-09 本文已影响0人
林拂晓
1.需求分析与思路
需求:将新浪新闻首页(http://news.sina.com.cn/)所有新闻都爬到本地。
思路:先爬首页,通过正则获取所有新闻链接,然后依次爬各新闻,并存储到本地。
2.代码编写
新闻爬虫代码1.需求分析与思路
需求:将新浪新闻首页(http://news.sina.com.cn/)所有新闻都爬到本地。
思路:先爬首页,通过正则获取所有新闻链接,然后依次爬各新闻,并存储到本地。
2.代码编写
新闻爬虫代码