python3 xpath获取页面注释的方法

2020-08-18  本文已影响0人  朝畫夕拾

from lxml import etree

html_str = """

<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!

<div id="box2">*****

<!--can u get me, bitch?-->

</div>

</div>

"""

html = etree.HTML(html_str)

print html.xpath('//div[@id="box1"]/div/node()')[1]

print type(html.xpath('//div[@id="box1"]/div/node()')[1])

print html.xpath('//div[@id="box1"]/div/node()')[1].text

"""output:

<!--can u get me, bitch?-->

<type 'lxml.etree._Comment'>

can u get me, bitch?

"""

上一篇 下一篇

猜你喜欢

热点阅读