图解HTTP-第5章-与HTTP协作的Web服务器
用单台虚拟主机实现多个域名
HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点.这是因为利用了虚拟主机(Virtual Host,又称虚拟服务器)的功能.
即使物理层面只有一台服务器,但只要使用虚拟主机的功能,则可以假想已具有多台服务器.
如果一台服务器内托管了www.tricorder.jp和www.hackr.jp这两个域名,当收到请求时就需要弄清楚究竟要访问哪个域名.
虚拟主机工作流程.png在相同的IP地址下,由于虚拟主机可以寄存多个不同主机名和域名的Web网站,因此在发送HTTP请求时,必须在Host首部内完整指定主机名或域名的URI.
通信数据转发程序:代理,网关,隧道
代理
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端"中间人"的角色,接收由客户端发送的请求并转发给服务器,同时也接收服务器返回的响应并转发给客户端.
Proxy-1.png代理不改变请求URI,会直接发送给前方持有资源的目标服务器.
持有资源实体的服务器被称为源服务器.从源服务器返回的响应经过代理服务器后再传给客户端.
在HTTP通信过程中,可级联多台代理服务器.请求和响应的转发会经过数台类似锁链一样连接起来的代理服务器.转发时,需要附加Via首部字段以标记经过的主机信息.
使用代理服务器的理由有:
- 利用缓存技术减少网络带宽的流量
- 组织内部针对特定网站的访问控制
- 以获取访问日志为主要目的
- 等等.
代理有多种使用方法,按两种基准分类.一种是是否使用缓存,另一种是是否会修改报文.
缓存代理
代理转发响应时,缓存代理(Cache Proxy)会预先将资源的副本(缓存)保存在代理服务器上.
当代理再次接收到相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回.
透明代理
转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy).反之,对报文内容进行加工的代理被称为非透明代理.
网关
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,它就像自己拥有资源的源服务器一样对请求进行处理.有时客户端可能都不会察觉,自己的通信目标是一个网关.
利用网关可以由HTTP请求转化为其他协议通信.png网关的工作机制和代理十分相似.而网关能使通信线路上的服务器提供非HTTP协议服务.
利用网关能提高通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全.比如,网关可以连接数据库,使用SQL语句查询数据库.另外,在Web购物网站上进行信用卡结算时,网关可以和信用卡结算系统联动.
隧道
隧道是在相隔甚远的客户端和服务器两者之间进行中转,并保持双方通信连接的应用程序.
隧道.png隧道的目的是确保客户端能与服务器进行安全的通信.
隧道本身不会去解析HTTP请求.也就是说,请求保持原样中转给之后的服务器.隧道会在通信双方断开连接时结束.
保存资源的缓存
缓存是指代理服务器或客户端本地磁盘内保存的资源副本.利用缓存可减少对源服务器的访问,因此也就节省了通信流量和通信时间.
缓存服务器是代理服务器的一种,并归类在缓存代理类型中.换句话说,当代理转发从服务器返回的响应时,代理服务器将会保存一份资源的副本.
缓存-1.png Proxy-2.png缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源.因此客户端可就近从缓存服务器上获取资源,而源服务器也不必多次处理相同的请求了.
缓存的有效期限
即使存在缓存,也会因为客户端的要求,缓存的有效期等因素,向源服务器确认资源的有效性.若判断缓存失效,缓存服务器将会再次从源服务器上获取"新"资源.
缓存的有效期限.png