使用爬虫知识点(ajax,cookie,代理ip)
2019-04-26 本文已影响0人
阿清_bd8d
爬取ajax网页方法
1,直接分析ajax调用的接口,然后通过代码请求这个接口。
2,使用selenium+chromedriver模拟点击获取数据。
cookie操作
1,获取所有的cookie:
for cookie in driver.get_cookie():
print(cookie)
2 , 根据cookie的key值获取value:
value = driver.get_cookie(key)
3 , 删除所有的cookie:
driver.delete_all_cookies()
4 , 删除某个cookie:
driver.delete_cookie(key)
使用代理IP
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('')
driver_path = ''
driver = webdriver.Chrome(executable_path=driver_path,chrome_options=options)
driver.get('url')