JavaScript解析:让搜索引擎看到更真实的网页

作者:Lgo100 来源:未知 2012-07-04 20:42:22 阅读 我要评论 直达商品

  四、关于AJAX

  AJAX是极为常见的网页技术,根本上说就是在网页显示期间,动态的从互联网上获取一段数据(可能是HTML也可能是其它),经过处理后加以显示。

  对于该技术,根本的工作并不在于XMLHttpRequest对象的实现,而是在于对搜索引擎爬虫架构的影响。众所周知,爬虫抓取页面,遍历其链接,再依次抓取的形式设计的,其工作主要集中在调度和控制抓取压力上,抓取器本身较为简单,通常不具备抓取后即时执行JavaScript并抓取AJAX数据的能力,因此需要技术升级方可支持AJAX。

  对抓取器的分析超出了本文的范围,有兴趣的读者可以查看其它相关文献。

  总结

  通过前面的案例分析,我们总结出了实现JavaScript解析所需要的基本工作,此外再增加一定的基础性建设就能构成一套较为完整的系统了。这里我们再次整理一下,将其分为三个部分:

  1. 在HTML解析器中嵌入JavaScript语言引擎,语言引擎可以选择V8、SpiderMonkey等成熟的开源方案。

  2. 实现所需的功能函数,具体可参考W3C的相关HTML和DOM规范。

  3. 作为一个直接推论,需要收录所谓的.js文件,这是JavaScript解析所需要“解析”的源代码。

  本文中介绍的功能仅是一部分较为常见的JavaScript功能,要让搜素引擎真正看到实际的页面还需要进一步实现其它需要的功能,此外还需要配合对HTML、CSS、图片等资源的支持。

  最后,对于希望使用JavaScript的站长来说,本文给出如下建议:

  1. 不要使用过于复杂的JavaScript技术,这不利于搜索引擎的收录

  2. 不要阻止对.js文件的收录,否则会限制JavaScript解析的能力

  3. 合理的划分站点的静态部分和动态部分


  推荐阅读

  经历6.28百度K站后从中得到的教训以及学习的经验

相信论坛里面大部分人都经历百度6.28K站的黑色风暴,风暴过后,大部分网站都惨不忍睹。特别是靠流量吃饭的个人站长,多少因为网站优化操作失误造成的被K掉或者说直接收录狂减。经历这次洗礼,基本上所有的站长论坛都>>>详细阅读


本文标题:JavaScript解析:让搜索引擎看到更真实的网页

地址:http://www.lgo100.com/a/34/20120704/73289.html

顶一下

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度