charset中gbk或utf8对seo的影响

作者:Lgo100 来源:未知 2012-05-14 10:50:51 阅读 我要评论 直达商品

  看到有人问gbk和utf-8对于seo的影响,我说点个人看法。

  如果网站是面向国人的,建议使用gbk,理由如下:

  1.gbk采用双字节表示汉字,utf-8采用三个字节表示汉字,从表示一个汉字所占的字节数来说,gbk相对于utf-8可以节约50%的空间。

  2.目前开源的程序gbk编码相对成熟一些。

  3.蜘蛛在爬行某个页面的过程中识别的charset属性值如果为gbk的话基本上可以确实为中文类型的网站(无需对后面的内容进行判断),如果为utf-8的话还需要进一步判断(例如检索全文中的字符有多少属于utf-8中文字符的范围)。

  如果网站是外文的话果断utf-8吧。

  还有一点需要注意的是由于gbk和utf-8的编码不同,如果网站在被收录之后更改charset的话,蜘蛛在抓取过程中如果不能及时的发现charset变动的话就会判定网页内容发生异常导致页面被K。

  以我自己的论坛为例(以下例子与实际情况还有点出入,仅用来说明大概意思),如图1所示,论坛采用的编码为gbk,浏览器正常显示。

  图1:

  

 

  如果强制浏览器以utf-8编码解释的话就会是图2的样子。

  图2:

  

 

  同样的道理,如果之前采用的是utf-8编码,而且页面已经被搜索引擎收录,如果中途换成gbk编码的话,在蜘蛛爬行过程中如果蜘蛛不能及时发现charset属性值改变的话还会按照之前的编码进行解析,结果就是与之前正常的页面相比产生了很大的变动,进而导致页面被K的可能。

  理论需要去实践,我用自己的一个页面进行了这个实验(页面地址http://sl.zoum5.com),之前采用的是utf-8编码,之后改成gbk。在5月5日时这个页面搜索关键词“收录批量查询”位于第一,今天在百度中已经失去了踪影,至于中途改变编码会不会影响之前积累到的权重,还需要进一步观察。

  截止到5月13日,被k的页面已经正常恢复了,持续了大概五六天的样子。

  原文地址:http://www.zoum5.com/seo/119.html


  推荐阅读

  分析国内SEO现状:做SEO的为何遭人烦?

今天在知乎看到了一个帖子:怎么看待知乎上“XXX是什么样的网站”的问题。回答问题的大部分观众都对这种行为嗤之以鼻,冠以广告软文之说。>>>详细阅读


本文标题:charset中gbk或utf8对seo的影响

地址:http://www.lgo100.com/a/34/20120514/59792.html

顶一下

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度