PHP实现高并发服务器
没图、直接上正文
一提到高并发,就没有办法绕开I/O复用,再具体到特定的平台linux, 就没办法绕开epoll. epoll为啥高效的原理就不讲了,感兴趣的同学可以自行搜索研究一下。
php怎么玩epoll?首先得安装个libevent库,再装个event扩展或者libevent扩展就可以愉快地玩耍了.
有些人搞不清楚libevent库跟libevent扩展的区别,简单来说,libevent库是C语言对epoll的封装,跟PHP毛关系都没有;libevent扩展就是PHP跟libevent库的沟通桥梁。实际上PHP的很多扩展就是干这个事的,有一些优秀的C语言库,PHP想直接拿来用,就通过PHP扩展的方式接入到PHP。
libevent扩展和event扩展随便选一个装,我个人更喜欢event扩展,因为更面向对象一点。自己去http://pecl.php.net里面搜跟自己PHP版本对应的扩展,下好编译安装一下就OK了.电脑装了多个版本的PHP编译的时候注意一下,phpize的版本要对应上,别搞错了,典型的五步曲:
1我们要实现的服务器,传输层是TCP协议,应用层协议太多太复杂,限于篇幅,会简单地以HTTP服务器举个例子,HTTP协议本身就很复杂,要实现起来细节上有很多考究,我们也不会完全实现HTTP协议。
首先,创建一个socket,三步曲,socket_create、socket_bind、socket_listen,为什么是这三步曲呢?很简单,不管你传输层协议是啥,你下面的网络层协议你得选个版本吧,IPV4还是IPV6,传输层工作方式你得选一个吧,全双工、半双工还是单工,TCP还是UDP你也得选一个吧,socket_create就是这三个选项;确定了网络层和传输层,你得告诉我监听哪个端口吧,这就对应了socket_bind;然后你得开启监听,并指定一个客户端的队列长度吧,这就是socket_listen干的事。
创建完了,同步阻塞咱就不介绍了,一个进程同时最多hold处一个连接,多几个连接同时请求,就得等呗,超过了socket_listen指定的队列长度,就得返回504了。多进程也一样,几个进程就有几个并发,进程又是昂贵资源,而且进程的上下文切换费时费力,导致整个系统效率低下。
没关系,咱有epoll,hold住万千请求不是梦,先实现一个Reactor。libevent库就是Reactor模式,直接调用函数就是在使用Reactor模式,所以无需纠结到底php怎么实现Reactor模式。
2上面的代码很简单,简单解释一下概念,EventBase就是个容器,里面装的Event实例,这么一说,上面的代码就非常好懂了。 然后一个Server.
3Connection
4先创建Socket的三步曲,设置成非阻塞模式。然后把socket加到Reactor中监听可读事件,可读的意思就是,缓冲区有数据了,才可读。可读事件发生,说明有新连接来了,用stream_socket_accept接收新连接Conn,把Conn放到Reactor中监听可读事件,可读事件发生,说明客户端有数据发送过来了,循环读直到没数据,然后把Conn放到Reactor中监听可写事件,可写事件发生,说明客户端数据发送完了,把协议组装一下写入响应。
应用层如果是HTTP协议要注意一下Connection: keep-alive头,因为要复用连接,不要一写完就关闭连接。
撸完收工,用ab测一下并发,加-k参数复用连接,i5+8G,3W的并发没啥问题,当然我们这儿没有磁盘I/O,实际情况要从磁盘读取文件,读文件要通过linux的系统调用,而且有几次的文件拷贝操作,花销比较大,常用的解决思路是sendfile,零拷贝直接从一个FD到另一个FD,效率比较高,缺点就是PHP没有现成的已经实现sendfile的扩展,得自己动手,开发成本有点高。
ab测试PO图:
5这就是PHP实现高并发服务器的思路了,只要是用EPOLL解决的,思路都一样,都是三步曲,放到Reactor下监听FD事件。当然这个只是最简单的模型,还有很多可以改进的地方,比如说多进程,抄袭一下nginx,一个主进程+N个工作进程,多进程的目的还是想利用多核并行工作。C语言实现也是这样,只是你可能不用libevent库,自己封装EPOLL,毕竟libevent库有点重,你也用不到libevent的很多东西;当然了,C语言有一堆的数据结构以及定义在数据结构上的操作要写,没有GC,自己管理内存,还要有良好的设计,上多进程还得搞一搞IPC进程间通信的东西,开发难度比PHP要大地多,开发周期也很长,有兴趣的同学可以自己撸一个玩。