零基础-一起学爬虫

【零基础学爬虫】爬虫库

2019-03-13  本文已影响9人  大菜鸟_

爬虫库

form selenium import webdriver
driver = webdriver.Chrome()#会自动打开浏览器
dirver.ger('http://www.baidu.com')#此时chrome浏览器会自动访问百度
driver.page_source()#可以获取到网页的源码

javafrom selenium import wendriver
driver = wendriver.PhantomJS()
driver,ger('http://www.baidu.com')
driver.page_source();

from bs4 import BeautifulSoup
soup = BeautifulSoup('<html></html>','lxml')#解析html

from pyquery import PyQuery as pq
doc = pq('<html></thml>')
doc = pq('<html>hello</html>')
result = doc('html').test()
result#结果为hello

存储库

import pymysql
conn = pymysql.connect(host='',user='',password='',端口,db=‘MySQL’)
cursor=conn.cursor()
cursor.execute('sql语句')
cuesor.fetchone()#获取一条记录

import pymongo
client = pymongo.MngoClient('localhost')
db = client('newestdb')
db.insert('name':'cyb')
db['table'] = find_one(('name':'cyb'))#数据的查询

import redis
r = redis.Redis('localhost','6379')
r.set('name':'bob')
r.get('name')


扫描下方二维码,及时获取更多互联网求职面经javapython爬虫大数据等技术,和海量资料分享
公众号菜鸟名企梦后台发送“csdn”即可免费领取【csdn】和【百度文库】下载服务;
公众号菜鸟名企梦后台发送“资料”:即可领取5T精品学习资料java面试考点java面经总结,以及几十个java、大数据项目资料很全,你想找的几乎都有

扫码关注,及时获取更多精彩内容。(博主今日头条大数据工程师)
上一篇 下一篇

猜你喜欢

热点阅读