我爱编程

http入门

2018-01-10  本文已影响40人  joker731

万维网的来历:

1990年Tim Berners-Lee 发明了用网址就能访问网页的办法,他发明了第一个网页、第一个浏览器和第一个服务器。//那1990年之前的世界是怎么样的?
1965 年,Email 被发明出来,成为互联网的「杀手级」应用,因为你可以瞬间发一封信给远方的人,不需要信纸、邮票和邮递员。
1971 年,用 @ 符号来表示 Email 的方法被发明出来。我挺好奇之前的邮箱地址是怎么表示的。
1979 年,邮件讨论组被发明出来,人们可以在一个话题下公开地互发邮件。
人们通过 FTP 来下载文件附件
1980 年至 1990 年间,人们迫切需要一种更好的上网方式,很多方案被提出,如 HTTP 和 Gopher。后面的事情大家都知道了,HTTP 因为其易用性胜出。当时的邮件内容全都是普通文本,或者是类 Markdown 形式的文本(makedown是总结出来的,不是被发明的,)人们需要一种超级文本用来做页面跳转,也就是我们现在见到的 <a> 标签,不过那时的人还没想到这一点,当时的超集文本方案有很多,HTML 只是其中之一,而且当时的 HTML 也非常简陋,只有 11 个标签。在这种背景之下, Tim Berners-Lee(下文中称为李爵士) 在 1989 年至 1992 年间,发明了 WWW万维网,一种适用于全世界的网络。
主要包含三个概念

简单来说:URL 的作用是能让你访问一个页面,HTTP 的作用是让你能下载这个页面,HTML 的作用是让你能看懂这个页面。这是一个简单而完美的系统。

李爵士除了发明了这些概念,还付诸了行动:


什么是http?

http其实就是浏览器和服务器之间,在传输数据时所遵守的约定//阮一峰http入门博客


请求报文


请求报文具体作用

这是示例1执行命令行:curl -s -v -H "Frank: xxx" -- "https://www.baidu.com"
GET / HTTP/1.1                                   //这句话的意思:获取根目录内容(因为没写路径,默认根目录);使用http协议;使用http1.1版本
Host: www.baidu.com                     // 这句话意思:访问百度这个网站的域名
User-Agent: curl/7.54.0                 // 这句话的意思:我用的CURL软件;发起当前六句话请求
Accept: */*                                          //这句话意思:我接受你返回的任何内容
Frank: xxx                                            //这句话:随便加的,测试用,证明我可以加东西而已

示例2执行命令行:curl -X POST -s -v -H "Frank: xxx" -- "https://www.baidu.com"
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Frank: xxx

示例3执行命令行:curl -X POST -d "1234567890" -s -v -H "Frank: xxx" --  "https://www.baidu.com" 
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Frank: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded

1234567890                                              // 这时候你会发现,又多出了一些东西,多了四行东西,其中content-length顾名思义是上传的长度;content-type是上传的格式;空行就是空行;1234567890这是你上传的具体内容,也就是字串//


请求的格式

1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据

只要你不按照http协议去做,就出错


用 Chrome 发请求

打开 Network
地址栏输入网址
在 Network 点击,查看 request,点击「view source」
点击「view source」
点击「view source」
点击「view source」
终于点了?可以看到请求的前三部分了
如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
响应
请求了之后,应该都能得到一个响应,除非断网了,或者服务器宕机了。


响应示例
上面三个请求示例,前两个请求对应的响应分别为
HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: Keep-Alive
Content-Length: 2443
Content-Type: text/html
Date: Tue, 10 Oct 2017 09:14:05 GMT
Etag: "5886041d-98b"
Last-Modified: Mon, 23 Jan 2017 13:24:45 GMT
Pragma: no-cache
Server: bfe/1.0.8.18
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/

<!DOCTYPE html>
<html> <head> 后面太长,省略了……
HTTP/1.1 302 Found
Connection: Keep-Alive
Content-Length: 17931
Content-Type: text/html
Date: Tue, 10 Oct 2017 09:19:47 GMT
Etag: "54d9749e-460b"
Server: bfe/1.0.8.18

<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8"> 后面太长,省略了……
GET 请求和 POST 请求对应的响应可以一样,也可以不一样
响应的第四部分可以很长很长很长
响应的格式

1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
状态码要背,是服务器对浏览器说的话
1xx 不常用
2xx 表示成功
3xx 表示滚吧
4xx 表示你丫错了
5xx 表示好吧,我错了
状态解释没什么用
第 2 部分中的 Content-Type 标注了第 4 部分的格式
第 2 部分中的 Content-Type 遵循 MIME 规范
用 Chrome 查看响应

打开 Network
输入网址
选中第一个响应
查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
你会看到响应的前两部分
查看 Response 或者 Preview,你会看到响应的第 4 部分


HTTP 协议的底层其实是由 TCP 协议和 IP 协议(简称 TCP/IP)构建的。TCP 传输控制协议(Transmission Control Protocol)

//http规定了请求和响应四部分如何写,但是没有规定怎么传输,TCP就是来管传输的

  1. TCP 和 UDP 的区别是什么
    //TCP 可靠(我发的请求成功与否,我是知道的/就像我们访问谷歌首页,成功正常显示首页,不成功会显示具体错误的页面)、面向连接(传输的时候需要建立起两头连接)、相对 UDP 较慢;UDP 不可靠(发送一个请求,成功与否是不知道的),不面向连接(传输不需要建立连接)、相对 TCP 较快。搞定。

  2. TCP 的三次握手指的是什么
    //每次建立连接前,客户端和服务端之前都要先进行三次对话才开始正式传输内容,三次对话大概是这样的:

     1\. 客户端:我要连接你了,可以吗
     2\. 服务端:嗯,我准备好了,连接我吧
     3\. 客户端:那我连接你咯。
     4\. 开始后面步骤
    
    

如果你想更了解 TCP 可以看 此文,也可以买一本《TCP/IP 详解(卷一)》(共三卷,先只买一卷即可)。强调一遍,这不是前端的内容,只需稍微了解一下 TCP 即可。

IP 网络协议(英语:Internet Protocol)

只要你在互联网中,那么你就会有一个 IP。通俗上理解,IP 分为「内网 IP」 和「外网 IP」

端口

你想要访问一个设备(前提是你使用的是 TCP 或 UDP 协议。还记得吗,HTTP 就使用了 TCP),只指定 IP 是不够的,还必须指定端口(Port)。

端口其实就是一个编号,并不是一种硬件。

一个服务器(硬件)不一定只提供一种服务,比如一个服务器既提供 HTTP 服务,又提供 FTP 服务,还提供 SMTP 服务(邮件服务),那么只用一个 IP 是无法告诉服务器你想要使用哪种服务。

所以这里有一个重要的原则:一个端口对应一个服务。

比如

  1. 要提供 HTTP 服务你最好使用 80 端口(能不能使用别的端口?可以,不过不建议你违反约定)
  2. 要提供 HTTPS 服务你最好使用 443 端口(能不能使用别的端口?可以,不过不建议你违反约定)
  3. 要提供 FTP 服务你最好使用 21 端口(能不能使用别的端口?可以,不过不建议你违反约定)

问题1:我怎么知道应该使用什么端口?

维基百科 把 0 到 1023 号端口对应的服务都告诉你了,点进去看看吧。

问题2:一共由多少端口?

每个机器一共有 65535(2的16次方减1)个端口(这是协议规定的)。不过这些端口的使用由一些规定

  1. 0 到 1023(2的10次方减1)号端口是留给系统使用的,你只有拥有了管理员权限后,才能使用这 1024 个端口。
  2. 其他端口可以给普通用户使用
  3. 如果一个端口正在提供服务,也就是被占用了,那么就不能再使用这个端口。除非你先停掉正在占用这个端口的服务。以后你们会经常遇到这个问题。

总结

上面都是 TCP/IP 相关的知识,如果你记不住,就记住下面这句话:

使用 HTTP 协议访问另一个 IP 时,要同时提供 IP 和端口号,缺一不可。

那么问题来了

我访问 http://qq.com 时并没有提供端口号,为什么我依然可以访问

答:因为浏览器帮你加了默认端口号 80。

上一篇下一篇

猜你喜欢

热点阅读