解密大数据

Python 爬虫入门课作业2- 网页基础与结构分析

2017-07-12  本文已影响97人  不忘初心2017

课堂作业要求

作业内容

网页地址:http://www.jianshu.com/p/88d0addf64fa
浏览器:Chrome

HTML 基础

对html有一定基础,但有些元素不太熟悉,浏览页面源码时,摘录学习了下:

页面结构

这个页面由三大部分组成:

  1. 顶部导航栏
    包含简书的一些基本功能元素,以及用户信息文章入口

  2. 正文
    包含文章正文,作者及支持部分,作者与读者互动评论部分,以及页边栏

  3. 底部
    包含简书的一些推荐内容

图片.png

页面标签位置

根据页面三大部分,在chrome中通过开发者工具,查看各部分对应源码,分析各页面元素位置:

所有的页面内容均包含在 <body lang="zh-CN" class="reader-black-font">

图片.png
<nav class="navbar navbar-default navbar-fixed-top" role="navigation">

如要找到用户标签,可通过下面高亮的路径。


图片.png

全局图:


图片.png
上一篇下一篇

猜你喜欢

热点阅读