AJAX 抓取:网站站长和开发人员指南

作者:www.lgo100.com 来源:未知 2011-07-21 11:40:03 阅读 我要评论 直达商品

显示 Google 抓取 AJAX 内容所需执行的过程的示意图

 

    如果您通过 AJAX 应用程序处理要在搜索结果中显示的内容,我们会使用一种新的流程,它可帮助 Google(以及可能其他搜索引擎)抓取您的内容并将其编入索引。从过去的效果来看,AJAX 应用程序一直是搜索引擎难以处理的对象,因为 AJAX 内容是由浏览器动态生成的,因此抓取程序发现不了它。尽管现在有方法可以处理该问题,但是必须定期对其进行手动维护才能确保内容最新。

 

    相比之下,以下机制可以更好地帮助搜索引擎有效抓取内容并将其编入索引,这样就免去了网站站长定期手动维护索引内容的麻烦。如果您的 AJAX 应用程序采用此机制,其内容便可以显示在搜索结果中。该机制的原理如下:

 

  1. 网站采用 AJAX 抓取机制。
  2.  
  3. 您的服务器为每个 AJAX 网址提供 HTML 快照,即用户(使用浏览器)看到的内容。AJAX 网址包含哈希代码,例如
  4.  
  5. www.example.com/index.html#mystate,其中 #mystate 是哈希代码。HTML 快照是执行 JavaScript 后显示在网页上的全部内容。
  6.  
  7. 搜索引擎会将 HTML 快照编入索引,并在搜索结果中提供原始的 AJAX 网址。

    为了让此机制发挥作用,应用程序必须在 AJAX 网址中使用特定的语法(我们将其称为“漂亮网址”,您看完以下几节的介绍后就会明白为什么这样称呼它)。搜索引擎抓取工具可以将这些“漂亮网址”临时修改为“丑陋网址”,并从您的服务器上请求修改后的网址。请求“丑陋网址”可以指示服务器不要传回应在浏览器中显示的常规网页,而是传回 HTML 快照。当抓取工具获取了修改过的“丑陋网址”时,会将其内容编入索引,然后在搜索结果中显示原来的“漂亮网址”。也就是说,最终用户看到的始终是包含哈希代码的“漂亮网址”。以下示意图显示了该协议的原理:

 


  推荐阅读

  山东禹城市电力公司 以创先争优促企业科学发展

山东禹城市电力公司新办公楼 中国企业报 中国企业新闻网每日经济(记者 许顺喜 程东谦 通讯员卞长华 )报道: 山东禹城市电力公司用科学的理念、科学的制度和科学的方法提高了创先争优活动的科学化水平,充分发挥了党>>>详细阅读


本文标题:AJAX 抓取:网站站长和开发人员指南

地址:http://www.lgo100.com/a/guandian/yejie/20110721/10060.html

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度