Scrapy爬虫无法获取部分数据

2018-10-04  本文已影响0人  Orzlove
  1. 首先我们需要利用如下命令知道自己浏览器的版本(在浏览器搜索栏输入如下命令):

 chrome://version/

2.下载 chromedriver,并将chromdriver放置于python路径下(同python.exe一个文件下)。chromedriver与浏览器的版本对应关系可参考 此博客

3.利用如下代码即可获取到页面动态加载的信息了(这里省略了利用Scrapy建立爬虫工程和具体爬虫):

from selenium import webdriver
#作为测试,我们可以直接在parse函数中验证是否可以取到数据
browser = webdriver.Chrome()#注意Chrome()首字母大写
browser.get("http://fundf10.eastmoney.com/jdzf_002190.html")
data = browser.find_element_by_xpath("//*[@id='jdzftable']/div/ul[2]/li[2]").text#取标签动态加载的数据
上一篇下一篇

猜你喜欢

热点阅读