程序员java学习记录

JAVAWEB---JavaWeb简介、Http传输协议

2020-06-18  本文已影响0人  一花一世界yu

一、重点知识

dos命令 echo %path%输出环境变量配置

所有的a标签发送的请求都是get

所有直接输入网址发送的都是get请求

http底层为tcp

启动服务器后得第一件事查看日志是否有错误

二、课堂知识

第一章 JavaWeb简介

第1节 什么是web

web(World Wide Web)即全球广域网,也称为万维网,它是一种基于超文本和HTTP的、全球性的、动态交互的、跨平台的分布式图形信息系统。是建立在Internet上的一种网络服务,为浏览者在Internet上查找和浏览信息提供了图形化的、易于访问的直观界面,其中的文档及超级链接将Internet上的信息节点组织成一个互为关联的网状结构</pre>

第2节 什么是JavaWeb

使用Java技术实现上面的功能,即使用Java技术实现网络的互联互通</pre>


第二章 JavaWeb的技术体系

​​

image

</center>


第三章 JavaWeb服务器

第1节 JavaWeb服务器是什么

JavaWeb服务器又被称为JavaWeb容器是为JavaWeb应用提供运行时环境,它负责管理Servlet和JSP的生命周期,以及管理它们的共享数据。</pre>

第2节 常见的JavaWeb服务器介绍

常见的JavaWeb服务器有Tomcat,jetty,Weblogic等</pre>

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta([dʒəˈkɑːtə])项目中的一个核心项目由Apache、Sun(现已被oracle公司收购)和其他一些公司及个人共同开发而成</pre>

Jetty 是一个开源的servlet容器,它为基于Java的web容器,为JSP和servlet提供运行环境。Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布。开发人员可以将Jetty容器实例化成一个对象,可以迅速为一些独立运行(stand-alone)的Java应用提供网络和web连接</pre>

WebLogic是美国Oracle公司出品的一个application server,确切的说是一个基于JAVAEE架构的中间件,WebLogic是用于开发、集成、部署和管理大型分布式Web应用、网络应用和数据库应用的Java应用服务器。将Java的动态功能和JavaEnterprise标准的安全性引入大型网络应用的开发、集成、部署和管理之中</pre>

第3节 Tomcat服务器

Tomcat 是一个免费的开放源代码的Servlet容器,它是Apache软件基金会的一个顶级项目,由 Apache,Sun和其他一些公司及个人共同开发而成。由于有了Sun 的参与与支持,最新的 Servlet和JSP规范总是能在Tomcat中的到体现</pre>

​​

image

</center>

1. bin: 用来存放tomcat的命令,主要有两大类,一类是以.sh结尾的(linux命令),另一类是以.bat结尾的(windows命令)
2. conf: 主要是用来存放tomcat的一些配置文件
3. lib: 主要用来存放tomcat运行需要加载的jar包
4. logs: logs目录用来存放tomcat在运行过程中产生的日志文件
-- 在windows环境中,控制台的输出日志在catalina.xxxx-xx-xx.log文件中
-- 在linux环境中,控制台的输出日志在catalina.out文件中
5. temp: temp目录用户存放tomcat在运行过程中产生的临时文件
6. webapps: webapps目录用来存放应用程序,当tomcat启动时会去加载webapps目录下的应用程序。可以以文件夹、war包、jar包的形式发布应用
7. work: work目录用来存放tomcat在运行时的编译后文件</pre>

1.启动 startup
2.停止 shutdown</pre>

tomcat-users.xml用来配置管理tomcat的用户与权限</pre>

server.xml可以设置端口号、设置域名或IP、默认加载的项目、请求编码</pre>

需要修改三个端口号
AJP
HTTP
SHUTDOWN</pre>


第四章 JavaWeb的运行流程

​​

image

</center>

第五章 第一个JavaWeb应用

第1节 创建第一个JavaWeb项目

1. 打开Eclipse
2. File--> New-->Dynamic Web Project
3. 设置Project name
4. Dynamic web module version 选择2.5,
不选择2.5版本选择3.0版本文件中将不会出现web.xml文件,3.0版本通过注解配置文件
5. finish</pre>

第2节 项目结构介绍

<center style="box-sizing: border-box; margin-top: 0px; margin-bottom: 0px;"> image

</center>

</center>

1. src 里面放的是 java 源程序
2. JRE System Library: 指Java SE 的常用库文件集合,也就是 jar 包
3. Web App Libraries 是自己导入的项目依赖 jar 包
4. WebContent:一般我们用 Eclipse 的时候创建一个 Web Project,就会生成 WebContent 文件夹,用 MyEclipse 的时候创建一个 Web Project,就会生成 WebRoot 文件夹,这两个文件夹作用一样只是名称不同而已。WebContent 用来存放 JSP,JS,CSS,图片等文件,是项目访问的默认路径,也是工程的发布文件夹,发布时会把该文件夹发布到 tomcat 的 webapps 里.(用户可以直接访问到该目录下的资源)
5. META-INF:存放一些 meta information相关的文件的这么一个文件夹,一般来说尽量不要自己手工放置文件到这个文件夹
6. WEB-INF:WEB-INF目录是一个专用区域,容器不能把此目录中的内容提供给用户。这个目录下的文件只供容器使用,里面包含不应该由客户直接下载的资源。Web 容器要求在你的应用程序中必须有 WEB-INF 目录。WEB-INF 中包含着发布描述符(也就是web.xml文件),一个classes目录和一个lib目录, 以及其它内容。注意:如果你的Web应用程序中没有包含这个目录,它可能将无法工作.(这是一个安全目录,此目录下的资源不能被用户直接访问)
7. WEB-INF/lib 目录,该目录中的jar包是运行时环境下使用的jar包,所谓运行时环境下使用的jar包,就是说你在运行你的项目的时候所需要使用的jar包的集合</pre>

第3节 第一个web页面

在WebContent下创建一个index.html文件

添加 <h1>Hello JavaWeb</h1></pre>

第六章 HTTP协议

第1节 HTTP 基本概念

HTTP 是超文本传输协议,也就是HyperText Transfer Protocol,我们可以将HTTP的名字「超文本协议传输」,拆成三个部分
1. 超文本
2. 传输
3. 协议</pre>

HTTP 传输的内容是「超文本」

我们先来理解「文本」,在互联网早期的时候只是简单的字符文字,既现在「文本」

再来理解「超文本」,它就是超越了普通文本的文本,它是文字、图片、视频等的混合体最关键有超链接,能从一个超文本跳转到另外一个超文本

HTML 就是最常见的超文本了,它本身只是纯文字文件,但内部用很多标签定义了图片、视频等的链接,在经过浏览器的解释,呈现给我们的就是一个文字、有画面的网页了</pre>

所谓的「传输」,很好理解,就是把一堆东西从 A 点搬到 B 点,或者从 B 点 搬到 A 点</pre>

行为约定和规范,HTTP 协议是一个双向协议</pre>

HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」</pre>

第2节 HTTP 常见的状态码

状态码 描述 常见状态码
2xx 成功,报文已经收到并被正确处理 200,204,206
3xx 重定向,资源位置发生变动,需要客户端重新发送请求 301,302,304
4xx 客户端错误,请求报文有误,服务器无法处理 400,403,404
5xx 服务器端错误,服务器在处理请求时,内部发生错误 500,501,502,503

「200 OK」是最常见的成功状态码,表示一切正常。如果是非 HEAD 请求,服务器返回的响应头都会有 body 数据。
「204 No Content」也是常见的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。
「206 Partial Content」是应用于 HTTP 分块下载或断电续传,表示响应返回的 body 数据并不是资源的全部,而是其中的一部分,也是服务器处理成功的状态


「301 Moved Permanently」表示永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。
「302 Found」表示临时重定向,说明请求的资源还在,但暂时需要用另一个 URL 来访问
「304 Not Modified」不具有跳转的含义,表示资源未修改,重定向已存在的缓冲文件,也称缓存重定向,用于缓存控制


「400 Bad Request」表示客户端请求的报文有错误,但只是个笼统的错误。
「403 Forbidden」表示服务器禁止访问资源,并不是客户端的请求出错。
「404 Not Found」表示请求的资源在服务器上不存在或未找到,所以无法提供给客户端


「500 Internal Server Error」与 400 类型,是个笼统通用的错误码,服务器发生了什么错误,我们并不知道。
「501 Not Implemented」表示客户端请求的功能还不支持
「502 Bad Gateway」通常是服务器作为网关或代理时返回的错误码,表示服务器自身工作正常,访问后端服务器发生了错误。
「503 Service Unavailable」表示服务器当前很忙,暂时无法响应服务器,类似“网络服务正忙,请稍后重试”的意思</pre>

第3节 HTTP 常见属性字段

客户端发送请求时,用来指定服务器的域名。

Host: www.baidu.com</pre>

服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据长度

Content-Length: 23552</pre>

Connection 字段最常用于客户端要求服务器使用 TCP 持久连接,以便其他请求复用

Connection: keep-alive

但是,这不是标准字段,为了兼容老版本的 HTTP</pre>

Content-Type 字段用于服务器回应时,告诉客户端,本次数据是什么格式

Content-Type: text/html; charset=utf-8

上面的类型表明,发送的是网页,而且编码是UTF-8</pre>

如果服务器希望浏览器不是直接处理响应的实体内容而是让用户将响应的实体内容保存到一个文件中,这个时候需要设置Content-Disposition字段

方式:
1.inline : 直接在浏览器中打开
2.attachment : 以附件的形式下载

attachment的后面还可以指定filename参数

例子: Content-Disposition: attachment;filename=xyz.zip</pre>

客户端请求的时候,可以使用 Accept 字段声明自己可以接受哪些数据格式

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3;q=0.9

q:相对品质因子,默认是1,表示偏好哪一个配置

Accept: / 客户端声明自己可以接受任何格式的数据</pre>

Content-Encoding 字段说明数据的压缩方法。表示服务器返回的数据使用了什么压缩格式

Accept-Encoding: gzip

上面表示服务器返回的数据采用了 gzip 方式压缩,告知客户端需要用此方式解压</pre>

Accept-Encoding: gzip, deflate

客户端在请求时,用 Accept-Encoding 字段说明自己可以接受哪些压缩方法</pre>

用户代理,主要是告诉服务器我是用什么操作系统,什么浏览器发的请求,可以防止一部分机器人扫描网站数据.</pre>

一般被网站管理人员用来追踪访问者是如何导航进入网站的,因为进入一个网站不止可以从浏览器地址栏输入网址,还可以从一个超链接进入,通过这个属性来记录用户的访问来源,还可以防盗链.

什么叫防盗链?
比如一个网站,他自己的服务器上本身没有图片资源,但是他的网站上面却展示了很多图片资源,这些图片资源一般直接来源于别的网站,别的网站会根据此网站发送的图片请求,通过此属性判断是否为自己网站的请求,来禁止盗链</pre>

​​

image

</center>

​​

image

</center>

第4节 GET和POST请求

客户端向服务器端发送请求的方式有两种

Get 方法的含义是请求从服务器获取资源,这个资源可以是静态的文本、页面、图片视频等</pre>

而POST 方法则是相反操作,它向 URI 指定的资源提交数据,数据就放在报文的 body 里</pre>

第5节 HTTP协议特性(优势)

HTTP 最凸出的优点是「简单、灵活和易于扩展、应用广泛和跨平台」</pre>

HTTP 基本的报文格式就是 header + body,头部信息也是 key-value 简单文本的形式,易于理解。</pre>

HTTP协议里的各类请求方法、URI/URL、状态码、头字段等每个组成要求都没有被固定死,都允许开发人员自定义和扩充

同时 HTTP 由于是工作在应用层(OSI 第七层),则它下层可以随意变化
HTTPS 也就是在 HTTP 与 TCP 层之间增加了 SSL/TLS 安全传输层</pre>

互联网发展至今,HTTP 的应用范围非常的广泛,从台式机的浏览器到手机上的各种 APP,从看新闻、刷贴吧到购物、理财,HTTP 的应用片地开花,同时天然具有跨平台的优越性</pre>

HTTP 协议里有优缺点一体的双刃剑,分别是「无状态、明文传输」,同时还有一大缺点「不安全」


1. 无状态
无状态的好处,因为服务器不会去记忆 HTTP 的状态,所以不需要额外的资源来记录状态信息,这能减轻服务器的负担,能够把更多的 CPU 和内存用来对外提供服务。

无状态的坏处,既然服务器没有记忆能力,它在完成有关联性的操作时会非常麻烦。

例如登录->添加购物车->下单->结算->支付,这系列操作都要知道用户的身份才行。但服务器不知道这些请求是有关联的,每次都要问一遍身份信息

对于无状态的问题,解法方案有很多种,其中比较简单的方式用 Cookie 技术

2. 明文
明文意味着在传输过程中的信息,是可方便阅读的,通过浏览器的 F12 控制台或 Wireshark 抓包都可以直接肉眼查看,为我们调试工作带了极大的便利性

但是这正是这样,HTTP 的所有信息都暴露在了光天化日下,相当于信息裸奔

3. 不安全
通信使用明文(不加密),内容可能会被窃听。比如,账号信息容易泄漏
不验证通信方的身份,因此有可能遭遇伪装。比如,访问假的淘宝、拼多多
无法证明报文的完整性,所以有可能已遭篡改。比如,网页上植入垃圾广告,视觉污染

HTTP 的安全问题,可以用 HTTPS 的方式解决,也就是通过引入 SSL/TLS 层,使得在安全上达到了极致</pre>

第6节 HTTP 与 HTTPS

1. HTTP 是超文本传输协议,信息是明文传输,存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文能够加密传输。

2. HTTP 连接建立相对简单, TCP 三次握手之后便可进行 HTTP 的报文传输。而 HTTPS 在 TCP 三次握手之后,还需进行 SSL/TLS 的握手过程,才可进入加密报文传输。

3. HTTP 的端口号是 80,HTTPS 的端口号是 443。

4. HTTPS 协议需要向 CA(证书权威机构)申请数字证书,来保证服务器的身份是可信的</pre>


上一篇下一篇

猜你喜欢

热点阅读