爬虫简介

2020-07-25  本文已影响0人  livein80

端口 | 网络协议 | 网络模型 | HTTP响应

OSI参考模型

OSI参考模型
应用层 (对数据进行封装)
表示层
会话层
传输层 (TCP协议)
网络层 (IP协议)
数据链路层
物理层

数据传输的过程

发送者(数据封包)--> 物理层(发送者) --> 物理层(接收者) -->接受者(数据解包)

TCP/IP参考模型

TCP/IP参考模型
应用层(http协议,https+SSL)
传输层
网络层
主机至网络层

HTTP响应

HTTP请求到服务器的请求消息,包括以下格式:
请求⾏、请求头部、空⾏、请求数据
四个部分组成,下图给出了请求报⽂的⼀般格式。

爬虫概念

python做爬虫的优势

爬虫分类

关键性概念

1.请求方式:

2.URL组成部分

协议 主机名 端口号 猫点 编码
https new.qq.com 默认为80 #anchor 页面定位 在浏览器请求⼀个url,浏览器会对这个url进⾏⼀个编

3.User-Agent ⽤户代理

4.Refer

5.状态码

上一篇 下一篇

猜你喜欢

热点阅读