使用爬虫知识点(ajax,cookie,代理ip)

2019-04-26  本文已影响0人  阿清_bd8d

爬取ajax网页方法

1,直接分析ajax调用的接口,然后通过代码请求这个接口。

2,使用selenium+chromedriver模拟点击获取数据。

cookie操作

1,获取所有的cookie:

for cookie in driver.get_cookie(): 

      print(cookie)

2 , 根据cookie的key值获取value:

value = driver.get_cookie(key)

3 ,  删除所有的cookie:

driver.delete_all_cookies()

4 , 删除某个cookie:

driver.delete_cookie(key)

使用代理IP

from selenium import webdriver

options = webdriver.ChromeOptions()

options.add_argument('')

driver_path = ''

driver = webdriver.Chrome(executable_path=driver_path,chrome_options=options)

driver.get('url')

上一篇 下一篇

猜你喜欢

热点阅读