python爬虫大数据 爬虫Python AI Sql

小试牛刀--Python爬虫BeautifulSoup使用

2018-06-05  本文已影响8人  DDDDLU

python爬数据小试牛刀--beautifulSoup使用

1.环境配置

2.网站分析

 import urllib
 from  bs4  import BeautifulSoup 
 import urllib
from  bs4  import BeautifulSoup
f=urllib.urlopen("http://www.douyu.com")
html =f.read()
soup = BeautifulSoup(html, 'html.parser')
ss=soup.find_all('img')
print ss
lenth=int(len(ss))
print lenth
for i in range(lenth):
    url =ss[i].attrs['src']
    print url
    tad=url.rfind('.')
    print tad
    if tad>0:
       str= url[tad+1:tad+4]
       if str=='png':
           print "this is png"
           urllib.urlretrieve(url, './img2/png%d.png'%i)
       elif str=='jpg':
           print 'this is jpg'
           urllib.urlretrieve(url, './img2/img%d.jpg' % i)
       elif str=='gif':
           print "this is gif"
           urllib.urlretrieve(url, './img2/gif%d.gif' % i)
       else:print "Error"
       

3.总结

获取图片的过程中,发现图片有jpg,png,和gif,于是通过字符串操作,把格式区分开来。

上一篇下一篇

猜你喜欢

热点阅读