基于百度翻译的爬虫(二):页面篇
2018-01-25 本文已影响82人
云时之间
在这一篇文章里,我将通过一个开源的HTML页面再去进行修改,来达到我们的使用要求,最终的目的是学会我们如何使用网页,来达到自己的需求.
首先,我们的环境是Python3,并且之间会用web框架:tornado和request请求页面.
第一步:我们的固定写法,写一个逻辑处理模块
首先,我们导入tornado模块:
然后我们再引入tornado的固定格式:
上边这些都是使用tornado的固定格式,我们使用的时候只需要进行简单的修改就好,这也就是模块化开发的魅力和高效率.
第二步:返回一个页面
在这里,我们引入Free Bootstrap Admin Template | AdminLTE.IO,这样的一个模块
这个模块是基于Bootstrap 3进行自定义后的一个开源模块,这个模块的响应式布局做的很不错,可以用一下,在这里我进行了修改,在GitHub文件里有index和search.html两个文件,这个index是可以用,但是search.html是未来写匹配的时候用的,现在我们先不用它.
第三步:套模板
1:规范模板的路径,设置静态文件路径
因为这个页面中有很多的动态组件,所以我们要进行写好静态组件的位置方便之后进行引用.
第四部:前端提交数据给后端
在html中,from是HTML的一个标签,是专门用来提交数据的.在我们的index.html的文件里
method是方法,这个index是post方法
action是路径,这个index的路径是/search
这是网页中的输入框,其中name就是这个输入框的名字,我们在输入单词的时候,我们应该传入到后台,然后在进行查询.
这时候,我们运行代码,并且在页面上输入想要查询的单词,我们就可以在后台读取数据了.基本思路是:
最终效果如下:
项目代码: