关于前端SEO要点(一)
背景:很多SEOer认为,网站运营只需要懂SEO技能,但一个资深SEO必须对搜索引擎原理,前后端的工作协调有全面的了解,本期介绍下关于前端SEO要点。
一、 搜索引擎原理
搜索引擎的自动搜索功能分两种。一种是定期搜索,即每隔一段时间(比如goole一般是28天),搜索引擎主动排除‘蜘蛛’程序,对一定ip地址范围内的网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网站,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
搜索引擎的基本工作原理包括如下三个过程:
1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3、提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
二、前端SEO
站内优化顾名思义就是指网站内部优化,即网站本身内部的优化。包括代码标签优化、内容优化和URL优化 。以下从前端人员职责分析与推荐SEO方法。
1) 标签
①meta标签、title标签
这可谓是搜索引擎蜘蛛爬去网站首先要经过的路径,在网站中占有很大的比重,所以,合理设置有很大的作用
title,也就是标题,是在浏览器上面显示出来的,方便用户了解这个页面的内容;特别是搜索引擎判断你网页内容的主要根据。搜索引擎就很大部分是依靠网站title来判断你网站是关于什么内容的。所以,要重视title。
< meta name="keywords" content="关键词1,关键词2" />
目标关键字在文章中自然分布,不堆砌,不刻意
< meta name="description" content="描述1,描述2" />
网页描述,需要高度概括网页内容,切记不能太长,过分堆砌关键词,每个页面也要有所不同。
②语义化标签
不要什么都用div,尽量让代码语义化,在适当的位置使用适当的标签,用正确的标签做正确的事。根据内容的结构化,选择合适的标签便于开发者阅读和写出更优雅的代码的同时让浏览器的爬虫和机器很好地解析。比如:h1-h6 是用于标题类的,标签是用来设置页面主导航的。尽可能少的使用无语义的标签div和span。在语义不明显时,尽量使用对兼容有利的标签。不要使用纯样式标签。需要强调文本,可以包含在strong或者em标签中等等。
③其它
图片标签img添加alt属性说明,当图片未成功显示时,仍可显示文本。
a标签页内连接,要加title属性说明,让访客和 “蜘蛛” 知道。而外部链接,链接到其他网站的,则需要加上 rel="nofollow" 属性, 告诉 “蜘蛛” 不要爬,因为一旦“蜘蛛”爬了外部链接之后,就不会再回来了。
尽量少使用iframe,因为蜘蛛一般不会读取其中的内容
2) 内容
合理规划站点结构,扁平化目录结构,尽量让蜘蛛只要跳转3次,就能到达网站内的任何一个内页。太深蜘蛛就爬不起来。
辅助导航,面包屑导航,次导航,网站地图等设置。可以为蜘蛛起引导作用,让蜘蛛清楚网站结构,方便抓取,增加收录。
页面结构简洁,不宜过大,避免访问超时。切忌网站内容重复。
内容页结构设置,如文章分最新、推荐、热门等,增加相关性。方便抓取更多内容。
设置好404页面,减少网站跳出率。
重要内容不要用js输出,因为蜘蛛不会执行js
谨慎使用display:none,搜索引擎会过滤掉其中内容
巧妙布局,将重要内容放在html文档前面,让蜘蛛优先读取。
3)链接
链接相当于蜘蛛的桥梁,缺少的话会影响蜘蛛爬去到内页,影响网站收录数量。但是也不宜过多,影响用户体验。对于中小型企业网站,首页建议链接在100个以内,链接性质可包含页面导航、锚文字链接等。
内链采用绝对路径,减少响应时间,例如
避免出现死链接,减少给搜索引擎堵塞;
页面跳转尽量使用a标签,而不是js控制跳转。
4) 单页面应用
目前流行的单页面应用都是采用js等搜索引擎无法识别的技术来做的,蜘蛛无法执行js,相应的页面内容也无从抓取。
但我们知道,传统的服务端生成页面,response里已经是服务器渲染组装好的HTML代码,浏览器只负责正确地展现,蜘蛛负责正确的解析,所以,我们需要给蜘蛛渲染完成的HTML,那么你的框架需要兼容如下流程的功能。
好了,本期流量运营知识点就分享到这里啦~~