浅谈网页搜索排序中的投票模型

作者:Lgo100 来源:未知 2012-05-29 10:14:32 阅读 我要评论 直达商品

  方案7:博达制,公众对候选人排序,假若有n个候选人,第一位的候选人得n分,第二位得n-1分,以此类推,然后统计每个候选人的总分,获得最多分的获胜。

  有人对博达制的攻讦是:可能有选平易近会操作这种体例进行作弊(投“策略票”),最撑持B的候选人原本心目中的排序是B>A>C,可是因为相对A,他们仍是更喜欢B,是以,为了把B拉上来,就得把A拉下去,他们的投票就酿成了B>C>A。博达对此攻讦的回应是:我的轨制只合用于老实的投票者。

  而这本书的作者却认为博达制的“策略票”问题没那么严重,如不美观无法切确展望平易近意和切确节制策略票的投法,有可能因为用力过猛,不单把A拉下来了,反而让C获得的撑持票增添,这样就使得最撑持B的那些人的“策略票”反而使得他们最厌恶的C被选了,昔时在IMDB上就发生过近似一幕:

  片子《蝙蝠侠6》上映后,蝙蝠侠的粉丝们感受这部片太酷了,于是就想把蝙蝠侠6投成IMDB第一位,于是他们疯狂的给蝙蝠侠6打高分,而同时,也纷纷的给那时的IMDB第一《教父》投低分,导致的结不美观就是用力过猛,教父酿成了第三名,原本的第二肖申克的救赎(TSR)酿成了第二(原本的第二是排在教父后面,新的第二是排在蝙蝠侠6后面),尔后来,跟着疯狂粉丝的热情消退,理性的定见占有了优势,蝙蝠侠6的得分逐渐下降,跌到了第10。而教父仍是在肖申克的救赎后面,良久没有回去了。

  博达制是否有其他问题呢?

  以上只是对这本书第14章的一个标识表记标帜,也仅仅针对“多候选人单职位”问题进行了谈判,书的后面还会对“多候选人多职位”的情形继续切磋,也就是按照每小我对候选人的排序,来抉择最终的候选人排序。

  回到搜索引擎规模来,如上策略的变迁会给我们一些启迪,先看看之前抽象出来的问题:

  有n个候选人,每个选平易近对这n个候选人投票,最终在n个候选人中选出最合适、最合适平易近意、也合适逻辑的阿谁人。

  这很像搜索引擎在解决的问题:

  系统里有n个网页,有m个特征(页面质量、页面内容丰硕度、页面超链、文秘闻关性等)对n个网页有分歧的打分,若何按照这些特征的“投票”,选出最适合放在第一位的网页呢?

  年夜选举的例子中,我们可以获得的几个启迪:

  1. 设计较法时,要避免呈现“赢者通吃”带来的信息丢失踪问题。

  而这个“多候选人排序”问题,是有一个“不成能的平易近主”的理论的,该理论的年夜意是,“合理”的平易近主应该知足3个前提:

  2. 不要因为某几个特征出格好,就把某个网页排到最前,或者因为某几个特征出格差,就把某个网页丢弃。

  3. 最合适放在首位的网页不必然是在每个特征上都最好,而应该是能够兼顾所有特征,综合默示最好的阿谁。

  4. 搜索引擎使用者对搜索结不美观的点击行为,可以算作是对搜索结不美观进行的“投票”,这样的“投票”信息的使用体例,也要注重考虑是否会带来选举过程中呈现的各种不合理。

  以上提到的各种选举方案,仅仅是对“多候选人单职位的”的情形进行谈判,而搜索引擎面临的问题,则更近似于“多候选人排序”的情形,也即:

  系统里有n个网页,有m个特征(页面质量、页面内容丰硕度、页面超链、文秘闻关性等)对n个网页有分歧的打分,若何按照这些特征的“投票”,抉择n个网页的挨次?

  1. 如不美观选平易近都认为A比B好,那么最终结不美观应该也是A比B好

  2. 没有“专制者”,也即,不存在这样一小我,无论别人怎么排序,最终结不美观的排序都和这小我的排序一致

  3. 无关身分m/?p=509

  按照“不成能的平易近主”理论,和搜索引擎连系起来看,似乎搜索引擎很难给出一个合理的网页排序,可是搜索引擎和投票又似乎有所分歧,有两个角度可以破解

  这样做的问题是会导致作者界说的一种“鹬蚌困局”,举例说,如不美观有ABC三个候选人,其中BC政见斗劲近似,撑持B的人也斗劲撑持C,反之亦然,在全平易近中,喜欢BC的人占年夜都,A的政见和BC相反,撑持A的人在全平易近中占少数。这样导致的后不美观就是,BC获得的票会斗劲分手,而A获得的票斗劲集中年夜而获告捷利,如不美观BC中有1人不加入选举,票就会集中到B或者C一小我的手中,年夜而使年夜都选平易近的撑持者被选。前面按下不表的戈尔失踪败的另一个原因,就是有人认为有跟戈尔政见近似的耐德的介入,他分手了部门戈尔的选票。

  2. 也许在网页排序问题上,真的存在这样一个“专制特征”,这个“专制特征”年夜今朝看来,最适合的应该就是“用户对劲度”了,按照用户的对劲水平来排序网页,就是最合理的网页排序。若何权衡“用户对劲度”呢?这就是我们一向在全力的。

  by liangaili


  推荐阅读

  搜索引擎判断网站是否作弊的原理分析(三)

广州seo陈永继续为巨匠讲解搜索引擎判定网站若何判定网站是否作弊的事理,上节讲解完TrustRank算法,这一节将具体讲解BadRank算法。 BadRank据传是Google采用的反链接作弊算法。它是一种典型的不信赖传布模子,即首先>>>详细阅读


本文标题:浅谈网页搜索排序中的投票模型

地址:http://www.lgo100.com/a/34/20120529/63962.html

顶一下

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度