06-数据提取-概念和分类
2019-03-06 本文已影响0人
Vanna_bot
爬虫中数据的分类:
- 结构化数据:json,xml等
json:可以通过键值对获取的数据
处理方式:json、jsonpath- 非结构化数据:HTML,字符串
没有规律
处理方式:re、xpath、bs4
爬虫中数据的分类:
- 结构化数据:json,xml等
json:可以通过键值对获取的数据
处理方式:json、jsonpath- 非结构化数据:HTML,字符串
没有规律
处理方式:re、xpath、bs4