腾讯研究院刘海龙:当模式识别遇上云计算

作者: 来源:未知 2012-03-05 15:30:39 阅读 我要评论 直达商品

9月10日下午,在中国科学院计算技术研究所一层报告厅,CSDN(微博)举办的“TUP第十四期:模式识别项目实战”活动上,腾讯研究院人机交互中心的研究员刘海龙,与大家一起分享了两大互联网巨头在模式识别与云计算、新型终端结合所带来的实践心得。对于模式识别技术的云服务,他从两个方面做了介绍:1)什么是模式识别的云服务?云服务会给模式识别的应用带来什么样的好处。2)从手写识别、语音识别、人脸识别的模式识别领域来分别介绍一下腾讯研究院来搭建模式识别云服务的实践。

腾讯研究院人机交互中心模式识别组研究员刘海龙
腾讯研究院人机交互中心模式识别组研究员刘海龙

以下是腾讯研究院人机交互中心研究员刘海龙的主题演讲实录:

我非常高兴能有这个机会来到TUP论坛跟大家做交流和分享。我的工作内容分为两部分,一部分是模式识别里面一些成熟技术和好的研究成果用于腾讯现有产品,来提升这些产品的用户体验。另外一部分要探索一些比较有意思,有创新性的模式识别的应用。

云计算

这个词现在非常火了,走到哪都能听到云存储、云杀毒、云输入等各式各样概念。现在趋势就是将来互联网大部分的应用都要向云计算的方向发展。广义云计算有一个定义,指的是服务的交互与使用,指的是通过网络以按需易扩展方式来获得所需的服务。具体到我们领域,模式识别云服务就是通过云端计算方式,提供模式识别的服务。具体来讲终端主要负责采集输入数据以及接收识别到的结果,模式识别其他的步骤,像特征提取,具体分类我们全部在云端来完成。从模式识别技术发展角度来讲,它也需要从传统的单机应用走向网络应用,跟云端这样的海量数据相结合,才能得到更好的应用发展。

关于云服务带给模式识别应用什么样的好处?

这里想举一个实际例子说明,这是工业界的例子,不是互联网的例子,我加入腾讯之前我在一家外企的邮政通话部门工作过很长时间,对这样的例子比较熟悉,今天跟大家分享一下。不知道大家有没有去过邮局分点中心,去过想象可以看到图上这些机器,我们写这些信到了邮局在机器上扫描装置,把邮件图象扫描下来,然后进行OCR识别。这个邮件图象经过OCR识别,加上上面信息,包括邮编、地址识别出来,然后分拣到各个地区,然后投递各个地方去。最初的时候有很多分拣机,包括分拣的数据都是放在本机上,这是单机分拣的形式。这样的形式有一些弊端,首先各个分拣机上它邮件的负荷不一样,经常有的比较忙,有的比较闲,计算资源不平衡,没有得到充分的利用。另外某一台OCR服务器宕机的时候,跟它相连的分拣机无法工作。后来想到把OCR服务器拆除下来,集中在一起形成OCR的识读池,来共同为为分拣机服务。这样的好处一是计算资源得到有效利用,这个各负载要做均衡。一旦某一台OCR服务器出现故障之后,其他的服务器会相应分担故障服务器的负载,保证识别功能一直具有高可用性。一旦分拣中心业务要进行扩展,分拣机数目增加,在识读池里面资源相应增加,按需扩展,不超前,不浪费。由于在分拣机和识读服务池之间数据传输是标准,是图象传递和识别标准传递,无论什么类型终端可以比较方便集成到系统当中,终端适配比较灵活。

再往后发展不仅是分拣中心当中各台分拣实现了资源调度,各个国家的这些分拣中心资源可以利用起来,所有分拣中心互联互通,形成开放式的识读架构,形成一种云OCR服务。当我们OCR识读器性能有所改进,想进行升级或者是地图数据有更新,需要变动的时候,你可以很方便的进行集中的升级维护。从刚才介绍这些特点可以看出来,实际上模式识别云服务,这是云OCR服务,实际上具有云计算的普遍优点,它是按需服务,资源利用率比较高。另外他冗余可靠性比较好,维护成本比较低,可扩展性能比较强。

针对模式识别问题,云服务还有很多更为重要的三条优点

第一个优点:模式识别需要大量样本,通过云服务可以收集到大量样本,更为重要是通过终端用户一些简单交互,比如对识别结果确认或者选择,可以得到很多有标签的。

第二个优点:对某一些模式识别任务而言,语音识别任务,云端提供终端不具备的计算和存储能力。现在发展趋势移动终端越来越成为主流,移动终端上计算资源和存储资源被弱化,还要考虑移动终端电池续航能力,很复杂的能力不能放终端,而是放到云端。

第三个优点:很多模式识别任务,人脸识别的任务,识别本身就在云端,所以数据本身存储在云端也是自然而然的事情。

云OCR服务

再往后发展不仅是分拣中心当中各台分拣实现了资源调度,各个国家的这些分拣中心资源可以利用起来,所有分拣中心互联互通,形成开放式的识读架构,形成一种云云OCR服务。

当我们OCR识读器性能有所改进,想进行升级或者是地图数据有更新,需要变动的时候,你可以很方便的进行集中的升级维护。从刚才介绍这些特点可以看出来,实际上模式识别云服务,这是云OCR服务,实际上具有云计算的普遍优点,1)按需服务,资源利用率比较高。2)冗余可靠性比较好,维护成本比较低,可扩展性能比较强。除了这些普遍优点之外,针对模式识别问题。

云服务还有很多更为重要的优点

1.模式识别需要大量样本,通过云服务可以收集到大量样本,更为重要是通过终端用户一些简单交互,比如对识别结果确认或者选择,可以得到很多有标签的。在刚才的例子当中,一旦有字符,识别度不高的情况下到人工标码处,这样长此以往积累越来越多,可以使我们识别性能不断往上提升。

2.对某一些模式识别任务而言,语音识别任务,云端提供终端不具备的计算和存储能力。现在发展趋势移动终端越来越成为主流,移动终端上计算资源和存储资源被弱化,还要考虑移动终端电池续航能力,很复杂的能力不能放终端,而是放到云端。

3.很多模式识别任务,人脸识别的任务,识别本身就在云端,所以数据本身存储在云端也是自然而然的事情。

腾讯研究院搭建模式识别云服务的实践

腾讯产品线非常丰富,无论是在桌面产品这部分还是无线产品这部分,这么多产品里面模式识别技术有很多可以发挥得地方,有很多用武之地。作为一个技术研究部门,腾讯研究院可以经常接触到从业务部门到来这些关于模式识别这些需求。以前在得到这些需求给业务部门做技术支持的时候,我们经常以提供算法库的形式做的,这样做有弊端,这样做是一次性的事情,不利于我们长远提高我们技术能力和算法性能。现在我们思路有所转变,向业务端提供算法库思路转变提供云服务的思路。

 1/7    1 2 3 4 5 6 下一页 尾页

  推荐阅读

  许鞍华: “人到老年可以是另外一种状态”

第一财经日报:《桃姐》乍一看很像纪录片,余力为的摄影也很朴实无华。采用这样的方式,是不是为了凸显情感的真实性? 许鞍华:主要是因为可以拍得很快,而且便于抓拍到养老院当时的状况和其他老人的反应。剧组拍摄的>>>详细阅读


本文标题:腾讯研究院刘海龙:当模式识别遇上云计算

地址:http://www.lgo100.com/a/kandian/20120305/36909.html

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度