使用 goquery
2018-06-26 本文已影响0人
智勇双全的小六
需要安装的依赖
- golang.org/x/net/html
golang.org/x/net/html 安装方法
git clone https://github.com/golang/net
也可手动下载后解压
在gopath目录的src文件夹内建立如下目录 golang.org/x/net,将上面下载的net里面的文件放到该net目录中即可!
使用
一句话秒懂,goquery 就是用 Golang 操作 dom tree。
假设需求,拿到 https://search.51job.com/list/080200,000000,0000,00,9,99,go,2,1.html
网址中所有的工作详情地址。
js 代码如下:
for(let i of document.querySelectorAll('p[class="t1 "]')){
console.log(i.querySelector("a").getAttribute("href"))
}
goquery 代码如下:
// document 把网页str 转化为 dom 对象。
document, err:= goquery.NewDocumentFromReader(strings.NewReader(content))
handlerErr.logFatal(err)
document.Find("p[class=\"t1 \"]").Each(func(i int, selection *goquery.Selection){
val,boolVal := selection.Find("a").Attr("href")
if boolVal{
fmt.Println(val)
}
})