任务34 - HTTP
2017-01-18 本文已影响0人
ReedSun_QD
问答
OSI 七层模型指什么 (难度***)
- OSI参考模型(OSI/RM)的全称是开放系统互连参考模型(Open System Interconnection Reference Model,OSI/RM),它是由国际标准化组织ISO提出的一个网络系统互连模型。
- 模型把网络通信的工作分为7层。1至4层被认为是低层,这些层与数据移动密切相关。5至7层是高层,包含应用程序级的数据。每一层负责一项具体的工作,然后把数据传送到下一层。由低到高具体分为:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
- 第7层应用层:直接对应用程序提供服务,提供网络服务的接口,常见的HTTP、FTP都属于此层。
- 第6层表示层:提供数据格式转换服务,例如:URL加密、口令加密、图片编解码
- 第5层会话层:建立端连接并提供访问验证和会话管理,例如使用校验点恢复通信,常见:服务器验证用户登陆、断点续传。
- 第4层传输层:提供应用进程之间的逻辑通信,例如:建立连接,处理数据包错误、数据包次序,常见:TCP、UDP、进程、端口(socket)
- 第3层网络层:为数据在节点之间传输创建逻辑链路,例如:对子网间的数据包进行路由选择,常见:路由器、多层交换机、防火墙、IP、IPX、RIP、OSPF。
- 第2层链路层:在通信的实体间建立数据链路连接,例如:将数据分帧,并处理流控制、物理地址寻址、重发等,常见:网卡,网桥,二层交换机。
- 第1层物理层:为数据端设备提供原始比特流的传输的通路,例如:网络通信的数据传输介质,由电缆与设备共同构成,常见的有:中继器、集线器、网线等。
HTTP 的工作原理是什么? (难度***)
-
HTTP协议采用请求/相应模型。客户端向服务器发送一个请求报文,请求报文包含请求的放大、URL、协议版本、请求头部、请求数据。服务器以一个状态行作为响应,响应的内容包括:协议版本、状态码、服务器信息、相应头部和响应数据。下图表明了这种请求/响应模型:
-
以下是HTTP请求/响应的步骤:
- 客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80)建立一个TCP套接字(socket)连接。
- 客户端连接到Web服务器
- 发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
- 发送HTTP请求
- 服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。
- 服务器接受请求并返回HTTP响应
- 释放连接TCP连接
Web服务器主动关闭TCP套接字,释放TCP连接;客户端被动关闭TCP套接字,释放TCP连接。
- 释放连接TCP连接
- 客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
- 客户端浏览器解析HTML内容
URI 的格式是什么?常见的协议有哪些 (难度***)
- URI(Uniform Resource Identifier),统一资源标识符,其格式如下:
protocol:// [username:password@]hostname[:port]/path/[;parameters][?query]#fragment
其中带方括号[]的为可选项
protocol -> 协议
username -> 用户名(不常用)
password -> 密码(不常用)
hostname -> 主机名
port -> 端口号
path -> 路径
parameters -> 参数(不常用)
query -> 查询字符串,是一组键值对,如有多个参数用“&”符号隔开
fragment -> 信息片断(hash),网页内部定位
- 常见的协议:
-
http
:HyperText Transfer Protocol,超文本传输协议,是互联网上应用最广泛的一种网络协议
-
-
file
:资源是本地计算机上的文件
-
-
ftp
:File Transfer Protoco,文件传输协议,用于Internet上的控制文件的双向传输
-
-
https
:Hyper Text Transfer Protocol over Secure Socket Layer,是以安全为目标的HTTP通道,,即HTTP下加入SSL层,简单讲是HTTP的安全版。
-
-
mailto
:创建一个指向电子邮件地址的超级链接,通过该链接可以在Internet中发送电子邮件。
-
-
ed2k
:eDonkey2000 network,中文名电驴,是一种文件共享网络协议
-
-
thunder
:迅雷专用下载文件协议
-
HTTP 协议有几种和服务器交互的方法 (难度***)
-
GET
:从指定的资源请求数据 -
POST
:向指定的资源提交要被处理的数据 -
HEAD
:与GET
相同,但只返回 HTTP 报头,不返回文档主体。 -
PUT
:向服务器发送请求,如果URI不存在,则要求服务器根据请求创建资源,如果存在,服务器就接受请求内容,并修改URI资源的原始版本。 -
DELETE
:删除指定资源。 -
OPTIONS
:返回服务器支持的 HTTP 方法。 -
CONNECT
:把请求连接转换到透明的 TCP/IP 通道,用于HTTP代理,不在网页开发中使用。
状态码200,301, 304,403,404,500,503分别代表什么意思 (难度****)
状态码 | 状态信息 | 含义 |
---|---|---|
200 | OK | 一切正常,对GET和POST请求的应答文档跟在后面 |
301 | Moved Permanently | 客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。(永久性重定向) |
304 | Not Modified | 客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。 |
403 | Forbidden | 资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。 |
404 | Not Found | 无法找到指定位置的资源。 |
500 | Internal Server Error | 服务器遇到了意料不到的情况,不能完成客户的请求。 |
503 | Service Unavailable | 服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个 Retry-After头。 |
报文有哪几部分组成? (可选 难度****)
- HTTP报文是简单的格式化数据块,每个报文都包含一条来自客户端的请求或者一条来自服务器的响应,由3个部分组成,如下所示
<request-line> // 请求行
<headers> // 首部
<blank line> // 空白行
[<request-body>] // 请求主体
- 在HTTP请求中,第一行必须是一个请求行(request line),用来说明请求类型、要访问的资源以及使用的HTTP版本。紧接着是一个首部(header)小节,用来说明服务器要使用的附加信息。在首部之后是一个空行,再此之后可以添加任意的其他数据[称之为主体(body)]。
请求头的格式和作用是什么?给个范例截图说明 (可选 难度****)
-
以访问百度首页为例,查看他的请求头如下图所示:
请求头
请求头 | 作用 |
---|---|
Request URL | 请求的URL地址 |
Request Method | 请求方法 |
Status Code | 返回的状态码 |
Remote Address | 远程IP地址 |
首部的格式和作用是什么?给个范例截图说明 (可选 难度****)
-
以访问百度首页为例,查看他的首部如下图所示:
首部
首部 | 作用 |
---|---|
Accept | 告诉服务器能够发送那些媒体类型(MIME) |
Accept-Encoding | 告诉浏览器能够发送的压缩编码格式 |
Accept-Language | 告诉服务器能够发送那些语言 |
Cache-Control | 随报文传送缓存指示 |
Connection | 客户端和服务器是否保持连接 |
Cookie | 客户端内的缓存 |
Host | 接收请求的服务器的主机名和端口号 |
Upgrade-Insecure-Requests | 用于让浏览器自动升级请求从http到https,让大量包含http资源的http网页直接升级到https而不会报错 |
User-Agent | 发起请求的客户端应用程序(浏览器) |
主体的作用是什么?给个范例(可选 截图说明难度****)
- 一般get方法的请求中没有主体,post方法的请求中主体为数据的字符串,而响应报文的主体即为网页的HTML文本
简述浏览器缓存是如何控制的(可选 难度*****)
- 浏览器是否使用缓存、缓存多久,是由服务器控制的。当浏览器请求网页时,服务器返回的HTTP响应报文中,包含有关缓存的4个字段的关键信息。
- Cache-Control : 缓存的指示信息
- Expires : 资源失效的日期
- Last-Modified : 资源最后一次的修改时间
- ETag : 对资源的唯一性标识
- 当 Expires 和 Cache-Control 同时出现时,通常后者会覆盖前者的设定。在过期时间以内,用户点击刷新按钮了大部分浏览器不会直接使用缓存中的数据,而会发一个条件请求。对于这类请求,浏览器会在请求头中包含
If-Modified-Since
或If-None-Match
字段。前者是浏览器当初得到的Last-Modified,后者是ETag。当服务器发现资源更新的时间晚于If-Modified-Since所示的时间,或者资源在服务器当前的ETag和If-None-Match所提供的不符时,会响应整个资源,否则只会响应一个304 Not Modified的状态码。 - 此外,如果资源过期,浏览器通常会有两种选择:重新下载这个资源,或发出一个条件请求。很多浏览器会采取后者,以节约资源。
下图各个参数是什么意思(可选 难度*****)
-
从上往下依次为:
题目图片
参数 | 作用 |
---|---|
Request URL | 请求的URL地址 |
Request Method | 请求方法 |
Status Code | 返回的状态码 |
Remote Address | 远程IP地址 |
Connection | 客户端和服务器是否保持连接 |
Content-Length | 响应主体的长度 |
Content-Type | 响应主体的MIME |
Date | 报文创建日期 |
Server | 服务器应用软件名称和版本 |
X-Powered-By | 非标准字段,表示PHP版本的信息 |
Accept | 告诉服务器能够发送那些媒体类型(MIME) |
Accept-Encoding | 告诉浏览器能够发送的压缩编码格式 |
Accept-Language | 告诉服务器能够发送那些语言 |
Cookie | 客户端内的缓存 |
Host | 接收请求的服务器的主机名和端口号 |
Origin | 表示源服务器 |
Referer | 提供了包含当前请求URI的文档的URL,告诉服务器自己来源 |
User-Agent | 发起请求的客户端应用程序(浏览器) |
X-Requested-With | 发送请求报文的方式 |