百度中文分词技术的一点小猜测

作者:Lgo100 来源:未知 2012-06-27 10:18:02 阅读 我要评论 直达商品

  大家都知道,百度的中文分词技术比GOOGLE做的好,以下引用网络上找到的一张图片说明:

百度谷歌分词对比

 

  从上图可以推断出,百度遇到一个关键字,应该是先不进行分词,而是先检索百度百科的词条和百度指数有指数的中文词进行匹配,无法精确匹配的话,再进行分词,前两年在百度搜索关键字“利川新闻网”时,被分为利川/新闻/网,自从这个关键字有指数以后,百度会把它当做一个完整的关键词。

  当然,百度的分词技术肯定比我个人推断出来的要复杂的多,作为百度旗下的产品,百度不会放弃自己的资源,肯定会参考百度百科的词条作为分词算法的一部分,所以同样做搜索的腾讯搜搜也开发了自己的百科,但是我们以后在做SEO的时候,遇到比较偏的长尾关键词不能被正确分词的情况下,可以在百度百科创建一个词条,然后在参考资料里加上自己的链接,这样还可以解决百度相关产品权重比我们的网站高的问题。

  本文由利川在线原创,A5平台首发,转载请注明出处,本文来源网址:http://www.445400.com/blog/610.html


  推荐阅读

  企业该如何利用好SEO与竞价让转化翻倍

随着互联网的发展,越来越多的企业也走上了网络营销的路线,有的做SEO,有的做竞价,有的既做SEO又做竞价,那么对于企业来说究竟成功的网络营销针对SEO和竞价该如何去做呢?针对目前企业网站要想推广出去,带来流量和>>>详细阅读


本文标题:百度中文分词技术的一点小猜测

地址:http://www.lgo100.com/a/34/20120627/71100.html

顶一下

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度