android studio 安卓7.0爬虫 学习记录 3

2018-01-21  本文已影响0人  黄荆_32f5

3 获取文章标题清单

3 1 查看页面元素

参考百度经验safari如何查看网页源码对浏览器进行设置。

设置完后可以看到每篇文章的位置。

3 2 在页面中选取需要的元素

参考jsoup帮助,按类进行选择 根据网页源码整理选取思路

选取的思路是先找到 class 为 excerpt 的 article ,然后再找 header,然后再找 h2 ,然后再找 a 。

可以获取到列表,但结果需要优化 参考进行改进 改进后结果 改进后的选择语句
上一篇 下一篇

猜你喜欢

热点阅读