解密大数据

爬虫入门L2 | 网页结构&元素标签位置

2017-07-17  本文已影响72人  conniesun

用上次L1作业的文档地址作为分析页面:
http://www.jianshu.com/p/0c007dbbf728

L1作业页面

先看网页结构

网页结构

网页的四个部分
<!DOCTYPE html> 这是说浏览器支持IE6-9?
<html>...</html>文档起终点
<head>...</head>文档头部
<body>...</body>文档主体

<head>部分

必须的包含的<title>元素:


head的title元素
<body>部分

body内容比较多,上张结构图看起来清晰点:

body.png

然后是各个元素的位置信息:

全局顶部导航栏.png title.png 作者区域.png 文章内容.png 页脚的专辑名称和版权信息.png 关注的作者信息.png 赞赏作者区.png 底部喜欢分享区.png 评论区.png 侧边栏.png 最下面灰色区域的收入专题.png 最下面灰色区域的推荐专题.png

然后查看了下元素id属性,
在查看器搜索id,出现35个id,大部分在head里面。还有在文档的网页里面。这里选取一个参考。

id属性.png

最下面能看到树状索引。


树状索引.png

L2还有部分内容需要消化,html基础知识还要补起来。

之后继续补充。。。

上一篇 下一篇

猜你喜欢

热点阅读