day43课堂笔记(HTTP以及Nginx)
2019-05-05 本文已影响0人
五月_w
第一章、思想
image.pngimage.png
第二章、静态网页资源
2.1、什么是静态网页资源?
放在服务器上看到的是什么,显示的就是什么、一旦存在与服务器上,就不会有任何变化
2.2、静态网页资源特点
1)图片、附件、视频,前端页面语言。html,.js,.css等
2)客户端解析,而不是在服务端解析。 性能优化解析
饭店:采购----炒菜、做饭----端上来----吃到。
饭店做,而不是客户做,叫做服务端解析
自助、火锅店更倾向于客户服解析
3)后端没有数据库
4)地址栏里没有特殊符号,例如&&、?等。
5)网页发布一旦发布完成就不会改变,除非人工修改。
6)存储地点,存储于NFS这样的服务里(共享存储)
7) 内容来源(核心:游用户上传图片和视频等;程序员开发的代码(.html,.js.css))
2.3、静态网页资源特征
1)每个页面都有一个固定的URL地址,切URL一般有。.html、.html、.shtml等常见形式为后缀,而且地
址中不含有问号“?”或“&”等特殊符号。
2)网页内容一经发布到网站服务器上,无论是否有用户访问,每个网页的内容都是保存在网络服务器文件系统上的,也就是说静态网页是实实在在保存在服务器上的文件实体,每个网页都是一个独立的文件。
3)网页内容是固定不变的,因此容易被搜索引擎收录(容易被用户找到)
4)网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大的时完全依靠静态
网页制作的方式比较困难(缺点)
5)网页的交互性较差,在程序功能实现方面有较大的限制(缺点)
6)网页程序在用户浏览器端解析,如IE浏览器,程序解析效率很高,由于服务端不进行解析,并且不需要
读取数据库,因此服务器端可以接受更多的并发访问。当客户端向服务器请求数据时,服务器直接把数据从磁盘
文件系统上返回(不作任何解析),待客户端拿到数据后,在浏览器端解析展现出来(优点)
2.4、静态网页语言
常见的静态网页语言有html、js、css、xml、shtml等。
静态网页的核心特点:
1) 程序在客户浏览器端解析,不读取后端数据库,因此性能和效率很高。
2) 因为后端没有数据库的支持,所以和用户的交互性较差,功能实现也很少。
2.5、静态网页架构思想
在高并发、高访问量的场景下做架构优化,涉及的关键环节就是把动态网页转成静态网页,而不直接请求数
据库和动态服务器,并且可以把静态内容推送到前端缓存(或CDN)中提供服务,这样就可以提升用户体验,节约服务器和维护成本。
第三章、动态网页资源
3.1、动态网页资源介绍
所谓的动态网页是与静态网页相对而言的,也就是说,动态网页的URL后缀不是.htm、.html、.shtml、
.xml、.js、.css等静态网页的常见后缀扩展名形式,而是以.asp、.aspx、,php、.jsp、.do、.cgi等形式
作为后缀的,并且一般在动态网页网址中会有标志性的符号——“?,&”,此外,在大多数情况下后端都要有数据库的支持等
image.png
3.2动态网页资源特点
1)网页扩展名后缀常见为:.asp、.aspx、.php、.jsp、.do、.cgi等。
2)网页一般以数据库技术为基础,大大降低了网站维护的工作量(优点)
3)采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、投票、用户管理、订单管理、发博文、发微信等等。
4)动态网页并不是独立存在于服务器上的网页文件,当用户请求服务器上的动态程序时,服务器解析这些程序并可能读取数据库返回一个完整的网页内容。
5)动态网页中的“?”在搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页,因此在企业通过搜索引擎进行推广时,需要针对采用动态网页的网站做一定的技术处理(伪静态技术)。一遍搜索引擎收录。
6)程序在服务器端解析,会消耗大量的CPU和内存、I/O等资源,并且多数还要读取数据库等服务,因此,其访问效率远不如静态网页,
7)在服务端解析动态程序的服务常见的有PHP引擎、Java容器(tomcat 、resin、iboss、weblogic)
3.3动态网页内容
1)文件结尾.php、.jsp、.asp、.do
2) 服务端解析,性能低,尽量转成静态内容,效率提高10倍
3)后端有数据库,内容来自数据库
4)地址里有特殊符号,“?”“&&”
5)磁盘存在动态程序文件,内容没有实体文件。
6)存储地点,存储于Mysql,mongodb这样的数据库里。
第四章、伪静态网页
4.1、伪静态网页介绍
伪静态就是通过(如rewrite)把动态网页的URL地址伪装成静态网页URL地址,但实质上用户访问的还是
动态网页,只不过给用户看起来URL地址是符合静态网页地址特征的,因此用户以及某些搜索引擎会误认为是
静态网页
4.2、伪静态网页特点
image.png4.3、伪静态网页作用
把动态网页URL改成静态网页的URL,虽然同样是消除了动态网页中的参数,但是并不需要生成任何网页,仅仅是改变了网页地址路径
这样做的主要目的:
1)让搜索引擎收录网站内容,实现让更多的用户访问企业网站内容
2)提升用户访问体验
4.4、伪静态网页缺点
动态网页伪装静态网页,虽然可以让搜索引擎收录,并且可以提升用户体验,但伪静态网页并不能提升网站的访问效率性能,从理论上来说还会降低网站的性能,没有动态转静态网页效率高
4.5、伪静态网页总结
1)利用rewrite技术将动态网页伪装成静态网页(URL地址改写)
2)便于搜索引擎收录提升用户访问量以及用户体验
3)转换伪静态会消耗资源,降低性能
4)尽可能将动态网页转换成真正的静态网页
5)并发量不是很大或者动态更新过于频繁的时候,用rewrite实现伪静态也是不错的
6)伪静态网页的实现过程,一般是由与运营产品提出需求,开发和运维共同实现的。
第五章、生产Web架构优化方案
1)凡是发布后不需要再改的的网站业务,都可以直接静态化(1台顶10台)
或者需要改也行,但是由公司内部人员也可以直接静态。
优酷,有用户上传(转码和审核的过程),自动给用户信念,别着急看
2)用户上传修改,然后还实时要求高。静态化最难
让发布人能实时看到,直接访问动态(查数据库和存储)
CDN提供内存访问、提供就近访问、提供相同的运行商访问(用户网通、访问网通服务器)
image.png
5.1、门户新闻业务(新闻网站一般都是静态网页)
新闻网站的特点是一旦发布完成,几乎不会改动网页内容。因此,对于新闻业务内容的静态化相对简单
第一步:程序要支持发布动态内容转成静态功能。
第二步:运维编辑人员发布新闻网页(内容进数据库,图片、视频进入存储)后,后台程序立刻将动态网页生成静态文件(生成.html文件放到存储上)。
第三步:运维人员通过发布或事件触发把运营编辑生成的静态网页发布到事先搭建好的公司集群服务器上
或者把静态内容同步到购买的全国CDN服务器节点上,然后在提供给用户提供访问浏览
5.2、视频网站业务
视频网站和新闻网站类似,特点都是一旦发布完成,几乎不会再改动网页内容,因此,实现视频业务高效访问也很简单
用户上传视频时,需要经历转码---->审核的过程(大概一个小时),然后一些热点视频也可能会被提前推送同步到CDN的核心节点或全国所有的CDN服务器节点,用户访问时才会更快。
第六章、网站流量术语
6.1、IP
IP(独立IP)即Internet Protocol,这里指独立IP数,独立IP数是指不同IP地址的计算机访问网站时被计算的总次数。
独立IP数是衡量网站流量得到一个重要指标。
一般一天内相同IP地址的客户端访问网站页面只被计算为一次
6.2、PV(page view) 一个页面浏览
PV(访问量)即Page View,中文页面浏览,即页面浏览量或点击量,不管客户端是不是相同,也不管IP是不是相同,用户每次访问一个网站页面都会被计算一个PV
一般为了防止用户快速刷PV,很多网站把PV的统计程序放在在页面的最下面
用PV衡量网站时,PV数反映的是浏览某网站的页面数量,每刷新一次页面也算一次。PV数与来访用户的数量成正比
6.3、UV独立访客
UV(独立访客)即Unique Visitor,同一台客户端(PC或移动端)访问网站被计算为一个访客。
一天内相同的客户端访问同一个网站只计算一次UV
UV一般是以客户端cookie等技术作为统计依据的,实际统计会有无误差
考虑到一台客户端电脑可能会有多人使用的情况,因此UV(独立访客)实际上并不一定是独立的自然人为访问
6.4、企业网站对IP 、PV、 UP的度量
对IP的度量:
1)分析所有Web服务器的访问日志信息,对IP地址段去重后计数
2)在网站的所有页面结尾,嵌入JS等统计程序代码,待用户加载网页后,IP即传给统计 IP的服务器,这种方法一般被第三方统计公司或企业内部开发日志分析程序时使用
3)用第三方大家比较信任的统计工具例如:谷歌的的统计(GA)
image.png
image.png
网站流量统治工具PWIKI awstats ELK收集日志
第七章、网络并发连接
7.1、 每秒内网站的最大处理的连接数,叫做并发连接数。
image.png image.pngimage.png