2019-03-03尝试用爬虫获取数据
2019-03-03 本文已影响3人
亲亲百合
在电脑上安装 requests,beautifulsoup:
pip install requests;
pip install beautifusoup4.
尝试用requests请求网页数据:
data:image/s3,"s3://crabby-images/e96c7/e96c74e251d76c726ed450364d0c4c088073310c" alt=""
用标签查看内容:
data:image/s3,"s3://crabby-images/9e02f/9e02f2da19ea8a281ded503d3874c2fd13e3cc15" alt=""
查找父子节点:
data:image/s3,"s3://crabby-images/da59e/da59ec1d5bfebe0b0dcb5068d320ac531ae4276e" alt=""
尝试用select方法获取:
data:image/s3,"s3://crabby-images/1b417/1b417e808e31244c7a4fd4766db28207256e435b" alt=""
最后一行好像不能同时获取两个class下的数据,不知道beautifulsoup怎么把整个数据导出来。。还没有完整的把整个过程走一遍。
data:image/s3,"s3://crabby-images/3f882/3f88274b2608d131b54a48db84fd1e60aaf64662" alt=""
尝试导出数据,但是出来的文档是空的,待解决。
用re模块的时候,电脑就转不动了,结果一直运行不出来。。。看我的电脑的cpu使用占比已经100%了。。。超级无语,电脑配置太低了吗!
用beautifulsoup也没有能把数据导出来用,下次完善。。