构建HTTP服务

2020-03-02  本文已影响0人  萘小蒽

TCP与UDP都属于网络传输层协议,如果构造高效的网络应用,就应该从传输层进行着手。
但是对于经典的应用层协议对于普通应用而言绰绰有余。Node提供了基本的http和https模块用于HTTP和HTTPS的封装,对于其他应用层协议的封装,也能从社区中轻松找到实现:

var http = require('http');
http.createServer(function (req, res) {
    res.writeHead(200, { 'Content-Type': 'text/plain' });
    res.end('hello world')
}).listen(1337, '127.0.0.1');
console.log('Server running at http://127.0.0.1:1337/');

上面的HTTP服务非常简单,但是他能维持的并发量和QPS都是不容小觑的。

1. 什么是HTTP

HTTP的全称是超文本传输协议,它构建在TCP之上,属于应用层协议。在HTTP的两端是服务器和浏览器,即著名的B/S模式,Web即是HTTP的应用。

2. HTTP报文

我们先采用curl(window,mac中自带的命令行工具)工具来获取报文。

>curl -v http://127.0.0.1:1337
* Rebuilt URL to: http://127.0.0.1:1337/
*   Trying 127.0.0.1...
* TCP_NODELAY set
* Connected to 127.0.0.1 (127.0.0.1) port 1337 (#0)
> GET / HTTP/1.1
> Host: 127.0.0.1:1337
> User-Agent: curl/7.55.1
> Accept: */*
>
< HTTP/1.1 200 OK
< Content-Type: text/plain
< Date: Mon, 24 Feb 2020 23:40:18 GMT
< Connection: keep-alive
< Transfer-Encoding: chunked
<
hello world* Connection #0 to host 127.0.0.1 left intact

上述信息中我门可以看到这次网络通信的报文信息分为几个部分:
第一部分内容为经典的TCP的3次握手过程

* Rebuilt URL to: http://127.0.0.1:1337/
*   Trying 127.0.0.1...
* TCP_NODELAY set
* Connected to 127.0.0.1 (127.0.0.1) port 1337 (#0)

第二部分是完成握手之后,客户端向服务器端发送请求报文:

> GET / HTTP/1.1
> Host: 127.0.0.1:1337
> User-Agent: curl/7.55.1
> Accept: */*

第三部分是服务端完成处理后,想客户端发送响应内容,包括响应头和响应体:

< HTTP/1.1 200 OK
< Content-Type: text/plain
< Date: Mon, 24 Feb 2020 23:40:18 GMT
< Connection: keep-alive
< Transfer-Encoding: chunked

第四部分是结束会话信息

Connection #0 to host 127.0.0.1 left intact

http特点

基于响应式,以一问一答的方式实现服务,虽然基于TCP会话,但是本身缺并无会话特点。

HTTP只做两件事:客户端处理HTTP请求,和服务端发送HTTP响应。

从协议的角度来说,很多应用中,比如浏览器,其实是一个http的代理,用户的行为将会通过它转化为HTTP请求报文发送给服务器端,服务器端在处理请求后,发送响应报文给代理,代理在解析报文后,将用户需要的内容呈现在界面上。

无论是HTTP请报文求还是HTTP响应报文,报文内容都是包括两个部分:报文头,报文体。


3. 请求报文

请求报文
请求行是由 请求方法、url字段、HTTP协议版本字段三个部分组成,它们用空格分开。
HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT

(1)请求头部
请求头部由键值对组成,关键字和值之间用 : 分开。请求头封装了有关客户端请求的信息,典型的请求头有:

请求头 含义
User-Agent 产生请求的浏览器类型,User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器
Accept 客户端可识别的响应内容类型列表。eg:Accept:image/gif,表明客户端希望接受GIF图象格式的资源;Accept:text/html,表明客户端希望接受html文本。
Accept-Language 客户端可接受的自然语言
Accept-chartset 客户端可接受应答的字符集。eg:Accept-Charset:iso-8859-1,gb2312.如果在请求消息中没有设置这个域,缺省是任何字符集都可以接受。
Accept-Encoding 客户端可接受的编码压缩格式
HOST 请求的主机名称,允许多个域名同处一个IP之地,即虚拟主机
Connection 连接方式(close或keep-alive)
Cookie 存储于客户端扩展字段,向同一域名的服务端发送该域的cookie
Authorization Authorization请求报头域主要用于证明客户端有权查看某个资源。当浏览器访问一个页面时,如果收到服务器的响应代码为401(未授权),可以发送一个包含Authorization请求报头域的请求,要求服务器对其进行验证。

空行
最后一个请求头之后是一个空行,发送回车符和换行符,通知服务器以下不会再有请求头。

(2)请求数据
请求数据不再GET方法中使用,而是在POST方法中使用。POST方法适用于客户端提交表单。与请求数据相关的最常使用的请求头是包体类型 Content-Type 和包体长度 Content-Length;


4. 响应报文

响应报文
(1)状态码

状态码有三位数字组成,第一位定义了响应的类别,可能有五种取值:

常见状态码描述文本有如下:

(2)响应头

响应头可能包括以下信息:

响应头 描述
Server Server 响应报头域包含了服务器用来处理请求的软件信息及其版本。它和 User-Agent 请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户端软件(浏览器)和操作系统的信息。
Vary 指示不可缓存的请求头列表
Connection 连接方式
www-Authenticate WWW-Authenticate响应报头域必须被包含在401 (未授权的)响应消息中,这个报头域和前面讲到的Authorization 请求报头域是相关的,当客户端收到 401 响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了Authorization 报头域的请求
(3)响应包体

服务器返回给客户端的文本信息

上一篇 下一篇

猜你喜欢

热点阅读