Python 学习笔记 074
关于爬虫的分类
今日编程小插曲:
怎么解决无法在浏览器中调用输入法的问题?
百度一下后发现应该是ctfmon.exe停止了运行,发现原因后就应该能解决了。
那些方法看起来比较复杂,给大家介绍下我刚用的方法吧!
首先 打开任务管理器,判断(确认)该程序确实已经停止了运行;
之后打开运行(快捷键Win+R)或者文件-运行新任务
粘贴文件存放路径让他重新运行就解决了~
文件存放路径 c:\windows\system32\ctfmon.exe
OK,搞定电脑issue,然后继续~
网络爬虫的分类
1. 通用网络爬虫
2 .聚焦网络爬虫
3. 增量式网络爬虫
4.深层网络爬虫
怎么说呢?通用网络爬虫就是咱们要学习的爬虫,也是使用的最多的那种爬虫~
1. 通用网络爬虫
1.1 概念
1.2 用户群体
1.3 目标
1.4 抓取流程
Pic - 1其实关于网页网址解析的那一套我可以重新演示下~
首先解析本地Host文件对应的域名和IP
比如这样 host文件中存在这样的两行
# 127.0.0.1 localhost
# ::1 localhost
127.0.0.1 rywbltest.com
简单解析如下:
1.# 为Host文件中自带的或者程序加的,可以认为其不存在
2.localhost和rywbltest.com都是域名
前面的是系统自带的特殊域名 后面的是我自己加的,用于我的个人网站的调试的
3.输入域名 电脑会在Host文件中查找对应的域名和IP地址
4.第一个对应为IPV4地址 第二个为V6地址
(二者具体还是有点差别的,不过现在我们就认为差不多咯)
就像这样
Pic - 2两个地址都是非公开的自定义域名,但是通过host文件自定义可以识别到自定义的IP,然后访问到对应的网站。
这里我吧我的网站解析到了本地环路地址127.0.0.1上。所以本地可以ping通,而且都可以通过地址或者域名来进行访问
Pic - 3嗯,大概就是这样子咯~
未完待续 2019年10月18日23:11:44