聚沙成塔--爬虫系列(八)(物以「类」聚,人以群分)
版权声明:本文为作者原创文章,可以随意转载,但必须在明确位置标明出处!!!
文章讲到这里,我不得不想先把面向对象的编程讲了,否则我们的代码看上去将会越来越乱,越来也不易管理。
什么是类
类是对现实生活中一类具有共同特征的事物的抽象。所有的事物都来源于生活,不管哪行哪业都是为了解决我们生活中的问题,编程亦是。
类的三大属性
- 封装:类将具有共同特征的一类事物抽象在一起,比如水果类包含苹果、香蕉、梨子、西瓜等等,这些具有同样属性的我们可以归为到一个类里
- 继承:类是有继承关系的,继承关系的作用是让子类具有自己特有的行为,不如西瓜是它是继承水果的,那么西瓜它可以定义自己特有的行为、属性,像有籽西瓜、无籽西瓜两种属性,子类可以继承父类的公有方法和属性。什么意思呢,就像你可以继承你爸妈的财产,但是你不能继承你爸妈的朋友,或隐私方面的东西,隐私方面的东西在编程语言中我们称之为private(私有的),私有的东西子女是不可以继承的。还有一点就是继承可以是多层级结构的,就像你可以继承你爸妈的财产,你儿子也能继承你的财产,那么你儿子的财产就包含了你的和爸妈的财产。
- 多态:从字面意思理解就是多钟形态,专业的解释就是:多态性是允许你将父对象设置成为一个或更多的他的子对象相等的技术,赋值之后,父对象就可以根据当前赋值给它的子对象的特性以不同的方式运作。专业解释我想信大多初学者都不明白啥意思。举个例子:某公司A和几个快递服务公司有合作关系,比如顺风、中通、申通。顺风快递给A公司打电话说你们公司今年的快件服务我包了,那么从签订合同日起,A公司的所有快递服务都会自动的通过顺风快递走,同理,明年若是中通签了合同,那么A公司明年的快递服务都自动的走中通快递服务。我相信讲到这里大家应该能明白多态是什么意思了,多态说百了就是种接口服务。就像公司A它提供了一个快递服务接口,那么只要是快递公司都可以去调用这个接口。调用接口后就按照自己公司的物流走就是了。
类的定义
class myclass(object):
class_suite
类的定义主要是使用关键字「class」,类定义好了以后可以在类里定义方法,变量;专业术语称之为行为,属性。
类的继承
class A(object):
def foo(self):
print('this is A')
class B(A):
pass
class C(B):
pass
if __name__ == '__main__':
cc = C()
cc.foo()
类C继承类B,类B继承类A,pass关键字的意思是什么也不做,在类中定义方法第一个参数都是self,表示类本身,如果你接触过C/C++语言,那么这里的self就跟C/C++语言里的this指针一个意思。
- 「if _name_ == '_main_'」:这一句是入口函数,当我们运行该程序时解释器从这里开始执行。
- 「cc = C()」:创建一个C类型的实例,只有创建了实例才能去调用类中的方法和属性,
- 「cc.foo()」: 这一句就充分体现了类的继承关系, 类C没有定义foo()方法,当时它继承了B,B又继承了A,所以C自然也就继承了A的foo方法,这就是继承的好处,如果父类提供了你需要的方法,你就不需要再去重复定义实现了。
继承中的覆盖(Overriding)
继承中的覆盖是什么意思呢,如果类B也要实现方法foo,当时它的方法和类A的行为是不是一样的,那我们就称这种行为为覆盖
class A(object):
def foo(self):
print('this is A')
class B(A):
def foo(self):
print('this is B')
class C(B):
def foo(self):
print('this is C')
if __name__ == '__main__':
cc = C()
cc.foo()
结果将会输出‘this is C’,类C中的foo方法就是C类特有的行为。那么到这里有认真思考过的同学就要问,我又想有自己的行为,也想调用父类的行为怎么办呢,看下面的代码
class A(object):
def foo(self):
print('this is A')
class B(A):
def foo(self):
A.foo(self)
print('this is B')
class C(B):
def foo(self):
B.foo(self)
print('this is C')
if __name__ == '__main__':
cc = C()
cc.foo()
执行的结果将会输出
this is A
this is B
this is C
super的使用
上面例子的写法虽然可以达到目的,但不是一种好的写法,它的不好之处在于若在你的工程中有大量的此种写法,那么若是类的继承关系变了,那你不得不在整个工程中去查找修改相应的代码,这里我们使用super的方式改写它。
class A(object):
def foo(self):
print('this is A')
class B(A):
def foo(self):
super(B, self).foo()
print('this is B')
class C(B):
def foo(self):
super(C, self).foo()
print('this is C')
if __name__ == '__main__':
cc = C()
cc.foo()
输出的结果和上面一致,使用super()的漂亮之处在于,你不需要明确给出任何基类名字...“跑腿事儿”,它帮你干了!使用super()的重点,是你不需要明确提供父类。这意味着如果你改变了类继承关系,你只需要改一行代码(class 语句本身)而不必在大量代码中去查找所有被修改的那个类的名字。
构造器init()
构造器也叫构造函数,当一个类实例化的时候它将会自动调用该函数,这里我们需要提点的是,在python中类B继承了类A,他们都实现了_init_()函数,那么当类B实例化的时候不会去调用类A的构造方法了,这个和C/C++,JAVA语言是不同的,大家要注意这点
class A(object):
def __init__(self):
print('this is A init')
def foo(self):
print('this is A')
class B(A):
def __init__(self):
print('this is B init')
def foo(self):
super(B, self).foo()
print('this is B')
class C(B):
def __init__(self):
print('this is C init')
def foo(self):
super(C, self).foo()
print('this is C')
if __name__ == '__main__':
cc = C()
cc.foo()
执行结果将会输出
this is C init
this is A
this is B
this is C
可以看到它并没有去调用A,B类的构造器init()方法,如果C不定义会输出什么大家可以自己去试试
私有属性,私有方法
在python中,类中的所有方法和属性默认是‘public’共有的,可以被继承的,那么如果想要属性和方法不能被继承怎么办呢,那就是在属性和方法的定义前加两个下划线, 特别需要提点的是我们自己内中定义的函数不要有想_xxx_()这种定义,这种定义是python内建函数的定义,切记、切记。
class A(object):
def __foo(self):
print('this is A')
class B(A):
pass
class C(B):
pass
if __name__ == '__main__':
print(dir(C))
cc = C()
cc.__foo()
执行结果将会出现下面错误
Traceback (most recent call last):
File "classtest.py", line 16, in <module>
cc.__foo()
AttributeError: 'C' object has no attribute '__foo'
多态的实现
下面我们将实现一个多态的例子来结束本章的内容,例子的来源还是用上面提供的快递服务
class Company(object):
#提供一个快递服务接口
def express_service(self, express_company):
express_company.send()
#顺风快递公司
class FS(Company):
def send(self):
print('welcome to express by FS')
#中通跨地公司
class ZT(Company):
def send(self):
print('welcome to express by ZT')
#申通跨地公司
class ST(Company):
def send(self):
print('welcome to express by ST')
if __name__ == '__main__':
service = Company()
#使用FS快递服务
fs = FS()
service.express_service(fs)
#使用ZT快递服务
zt = ZT()
service.express_service(zt)
#使用ST快递服务
st = ST()
service.express_service(st)
各位若是初学者一定要敲代码,去执行,去体会一下类的三大属性
note: 初学者最容易犯的错就是书面上看着挺简单的啊,把书一关上就懵了,想要成为一个程序员,一定要多去敲代码,切记,切记