jsoup

2016-10-11  本文已影响184人  linheimx

它在哪里?

  1. github
  2. 官网

它是什么?

一个html解析者

如一个浏览器一样, 它可以做出如下的行为:

  1. 从 url,file,string 中获取和解析成html。
  2. 通过DOM遍历或者CSS选择器来找出数据。
  3. 操作html的元素,属性和文本。
  4. 通过用户提交的白名单,来预防XSS攻击。
  5. 可输出干净的html。
  6. html有许多变种(规则不规范,程序员代码写的比较狂野),jsoup解析这样的html会将其解析成合理的dom树

文档结构

地址

doc
上一篇下一篇

猜你喜欢

热点阅读