Python基本爬虫（HTML下载器）

2017-12-12 本文已影响0人原来不语

# -*-encoding:utf-8 -*-
import requests
import urllib
class HtmlDownloader(object):
"""docstring for HtmlDownloader"""
def download(self,url):
    if url is None:
        return None
    print(url)
    headers = ("User-Agent",
               "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.94 Safari/537.36")
    opener = urllib.request.build_opener()
    opener.addheaders = [headers]
    urllib.request.install_opener(opener)
    r = urllib.request.urlopen(url).read().decode("utf-8")
    #print(r)
    """
    if r.status_code == 200:
        print("获取首个页面成功")
        r.encoding='utf-8'
        return r.text
    """
    #print(r)
    return r

Python基本爬虫（HTML下载器）

猜你喜欢

热点阅读