<b>进军教育搜索 百度搞不定的三件事</b>
作者:caiji 来源:未知 2013-05-04 10:07:11
阅读次
我要评论
直达商品
张迪欧
据报道,搜索引擎巨子百度起头涉足教育培训规模,低调测试一款新品。当用户在搜索栏中输入“雅思培训”时,搜索结不美观直接显示教学机构名称,其搜索深度已经接近课程级。这在教育培训行业是个爆炸性新闻值得剖析关注,因为此举有可能改变教育行业的推广名目。可是让我们抛开百度的年夜平台效应 ,仅年夜教育行业纪律出发,以沙盘演绎的体例剖析之后,至少今朝我认为,百度教育搜索应该有三件年夜事儿搞不定。
百度起头涉足教育培训规模
以上是百度以这种体例考试考试教育搜索时难以解决的三年夜问题,当然,百度作为流量巨子和资金巨子,必定会有不少高人年夜中经营,是以也许内部已经解决了这些问题,只是没有展示出来而已。这些问题如不美观能够解决,将为国内教育培训规模带来一次概缦泓性的转变,否则百度还不如自己另做或收购一家教育中心页网站更为平安妥帖。

第一个搞不定:课程数据是个黑洞。
如不美观百度此举是为了晋升搜索体验,那必定要采纳搜索引擎爬虫的体例向全行业抓取数据。否则如不美观百度的不抓取数据而是要求教育机构自行提交数据的话,此举将只是凤巢推广系统的一部门;这一点咱们暂且不表,留不才文言说。
先谈谈搜索引擎爬取的问题。可以说,所有的行业里,教育培训规模的课程数据整合是最难的,甚至难到了在逻辑上都不能验证通顺的水平。我之前介入过一个教育类垂直搜索引擎的项目,那一段时刻最年夜的恶梦就是数据问题。之所以最终选择了收集教育,就是因为收集教育的课程数据具有必然水平的可实施性。而百度这么年夜的动作不成能只知足于收集教育,他们的指向应该是全行业的线下教育搜索,于是,问题马上就要来了。
如不美观UE工程师能很好地解决这个问题的话,那么还有个更恐怖的问题根消融决不了,这就是展示单元的问题。百度按照测试页面的样子展示课程数据,其根基的单元就是“课”,而不是“校”。如不美观旧的搜索体例中,一个搜索结不美观页列表能最多容纳20个教育机构广告的话,那么新的教育搜索,一个页面最多只能容纳20条目程。如不美观用户想多看就只能翻页了…… 如不美观这样的话,用户不骂街才怪。
第二,课程数据难以抓取和更新。假定课程已经规范,但教育规模的网站之千姿百态是巨匠所公认。即便一家网站,分歧学科的页面html规范都分歧,更有甚者,教育机构的课程介绍根基以课表形式展示,这需要人类的智能去读懂。百度爬虫若何能把这么多种分歧的HTML,把这么多分歧逻辑的蓖ㄐ偶爬取拆解清算入库呢?这是人工智能规模的一浩劫题,生怕百度难以解决。即便真的做到了,那么教育机构的课表转变,搜索爬虫的更新频率能跟得膳缦愦?当然,百度可以让教育机构自动提交信息,这个在后文将进行切磋。
所以如不美观百度以搜索引擎的体例解决教育规模精准搜索的问题,只能牺牲量而求质,求质就得推广少数机构,推广少数机构就酿成磷贫费推广,成了凤巢系统的一部门,就成了广告行为。反过来,如不美观求量而牺牲质,那么这种数据黑洞解决不了,质量不高,百度吃力不奉迎。
第二个搞不定:搜索展示页空间不足,在产物层面解决不了教育规模的问题。
前文中已经铺垫过,即,如不美观百度采纳让教育机构推送课程数据的体例,像传统的竞价系统一样,只有付费的机构才可以推广,那么这种体例与百度的页面若何融合,与用户的阅读习惯若何融合,若何供给充实的展示空间,这将成为UE设计师的恶梦。
众所周知,搜索引擎SEM推广占领的就是搜索结不美观首页首屏的位置,而这个页面总共才有3到4频奔传统搜索结不美观里,一条搜索结不美观的Title和Description最多有四五行;但在百度教育搜索测试页面展示的,除了每条目程信息占有4行之外,顶部还要挂上筛选器,筛选器就占有了一年夜块空间。而且我们已经看到,这4行名目化的课程信息,其作为商业数据,行高必然要高于传统的文本。也就是说,百度教育搜索的搜索结不美观页与通俗搜索结不美观页对比,要吃失踪年夜量的高度,会把页面拉长良多,这很考验用户耐心。
用户会不满,教育机构也会骂街:“以前20块钱一个点击,我的机构介绍能上首页首屏第一位,此刻20块钱一个点击,我的机构只能上一个课程在膳缦沔,还没有毛遂自荐的处所。”
产物司理必定会很委屈,那么就把这种教育搜索缩成小块放在顶部吧,也会碰着同样的问题,在小块里展示校仍是课?展示“校”,和以前对比意义不年夜;展示“课”,每家教育机构的课都足够这个小框里翻页N次,这么多机构若何展示完全若何排序呢?如不美观竞价的话,若何按“课”向教育机构收费呢?教育机构会知足么?
首先是数据的规范性极低,无法统一展示。教育行业的素质是处事,依年夜分歧的学科拥有分歧的处事特征,分歧的机构则有分歧的课表尺度。就拿课时来说,A机构说的是课时,B机构谈的是学时,C机构爽性就按小时计费,D机构说一个月是个培训期,E机构也谈课时,但他们的一课时是30分钟……再说班型的概念,分歧机构的班型界说纷歧样,班型自己千变万化,而且还有同样概念分歧名称的班型。仅收集教育的现有机构,网校网抓取的班型就快要300种,更况且线下教育的复杂集群。再年夜教育机构来看,有的机构以教师引领,有的机构以教学的组织引领,有的是一对一教学,分歧的黉舍理念分歧,课程设置分歧,促销体例分歧,甚至根基的名词界说都分歧。这个不像什物商品,什物商品属性是根基规范的;也不像饭馆,饭馆是以“店”为单元去组织的。教育搜索引擎如不美观想做到真正的处事深度,那么必需以“课”为根基单元(百度今朝就是这么做的),这就相当于搜索到饭馆里“菜品”的级别了。在这种极不规范的市场下,根柢无法实现这种级此外抓取。如不美观百度提出自己的尺度,教育机构能否按照百度的批示棒去执行?如不美观百度把这些属性强行整合,那媚暌怪若何为用户供给切确处事呢?
推荐阅读
网站如何牵着搜索引擎的鼻子走路
在站长圈子里,如不美观要谈判seo与搜索引擎的关系,简陋会有这么三种不美观念: 第一种,也是斗劲初级的不美观念:搜索引擎就是全数,排名就是网站的生命线,流量就是站长的衣食怙恃,而seo是带来网站流量的独一手段>>>详细阅读
本文标题:<b>进军教育搜索 百度搞不定的三件事</b>
地址:http://www.lgo100.com/a/34/20130504/268091.html
1/2 1
2 下一页