腾讯研究院刘海龙:当模式识别遇上云计算

作者: 来源:未知 2012-03-05 15:30:39 阅读 我要评论 直达商品

刘海龙:人脸识别用的特征BABO(音)比较多,像你说表情、情绪,特征变化有多大,表情肯定属于一种内类的变化,肯定使你人脸特征发生变化,肯定有影响。

提问:以前有一种全新影像的特征提取跟咱们平面图象的特征提取是不是有什么不一样的地方?

刘海龙:这个我不太了解。

主持人刘江:进入今天最后一个环节,圆桌讨论,请海龙和陈波。今天话题很有意思,加上我们上次活动,其实核心综合起来就是自然用户界面,NUI,国外学术界也都在说这个话题。他包括其实触屏也算,手势、语音、体感、还有脑波。大家想之前微软研究院其实触屏方面研究,我们现在说的自然用户界面意味着什么?键盘、鼠标是不自然的,他说过如果未来有一天也许过了若干千年、万年,一台电脑,一台PC被后人挖出来,发现是这么复杂的键盘,后人肯定想这是什么生物在用,是有很多手指,键盘是很不自然的用户界面。只不过因为我们技术上有局限,只能做成这样。

刘海龙:我做支付识别,做博士论文很长时间,针对一个很特定领域要做很深,需要花很多精力,做很多努力。我觉得看你自己的需要,如果想比较快速做一个什么事情,没必要钻那么深,用现有技术可以的。如果想把某个地方做好,肯定要去读大量文件,看人家做的东西,自己想哪个地方可以再改进一些。做的好要钻进去,这是肯定的。

下面再提一个问题,是不是现在从产品研发角度来讲这是不是一个趋势,算法本身也许不是那么重要,数据其实更重要?

刘海龙:模式识别数据是很重要,算法改进费很大力气,数据有了,性能自然就上来了。

主持人刘江:你对你特定领域有一些东西总结比算法还要有效一些。之前他们推荐算法也有研究,像亚马逊(微博)包括电子商务网站,他们搞得更好,更匹配。包括豆瓣(微博)网络,跟你更相似的人,更相似的书等等。用户体验、界面方面把用户行为改一改更好的可以收集数据。

刘海龙:算法也是一直不断往前走才可以。

主持人刘江:科大讯飞已经做到了方言转为普通话,可以做到。

刘海龙:发型和年龄识别,因为发型不算是一个人脸决定,我们取人脸区域是从眼睛往下这么一个区域,人脸特征的区域。发型随时可以改变,现在识别出来可能跟发型有关系,我觉得这个不应该作为识别成这个人或者是那个人的判据。至于年龄,我觉得有什么好方法这个……

主持人刘江:以前研究人工智能就是机器,现在互联网就是人脸网,SNS这么发达,国外也在说集体智慧。你可以更多用人的智慧,对你算法整个系统智能化提高很有用。

提问:我听腾讯嘉宾说他们一直培训这个系统,训练他们做这些事情。介绍你们底层的东西。

刘海龙:神经网络已经热很多年了,大家对他的使用也很长时间,只是分类方法中其中一种,有其好处也有其缺点,好处就是不用操心那么多,有网络模型之后送到输入神经元,等训练就可以了,不用担心参数。比如对于汉字识别,几千个类别的识别问题,目前现在用神经网络做的效果不是很好。因为里面各种因素比较大,神经网络规模比较大的时候,训练各种问题比较多。有些真正实用的可能并不是听起来比较炫的。有些比较简单的如果加以合适训练方法可以达到很好算法,在时间和空间代价上会更好。

主持人刘江:你刚才说汉字识别用的什么分类器?

刘海龙:二次分类器。

主持人刘江:现在你们主要用的除了刚才说的神经网络,还主要用什么多?

刘海龙:可以举个例子,手写识别因为要放在手机上,他对资源容忍度特别低,这个空间不能超过两三兆有这样的要求。识别速度要很快,在手机上可以达到很快,这种情况下用分类器越简单越好。你在训练过程中再去调整,都能达到你的目的。

提问:国外也是关于识别技术,IBM今年还是去年发明沃森(音),他们美国知识竞赛回答问题,像你们语音识别还有文字识别有没有自我学习,把它完善。

刘海龙:肯定有的,服务上线之后定期把新的样本、新的语调拿过来,有一个反馈系统训练,得到新的模型会用来更新之前的线上旧的模型,这样经过定期迭代,性能逐渐出声的。这个要做成自动,人不用干预他,后台自己学习和更新,应该是这样。

提问:我是来自自动化所,我想跟刘研究员问一个问题,你们人脸识别系统里面一般只能采集传统网络只能采集一两个人脸数据。在你这一两个数据库里面,只有我的人脸一两个数据库,你在识别的时候我可能有不同的姿势,还有不同的光照情况,还有一些表情,你怎么处理这些问题?

刘海龙:很多应用中你用一张人脸做一个你的模板,这个人会有很多变化,可能会侧身,怎么办?要靠离线样本,他代表了人脸整个变化的情况。当你离线样本有几千、几万的时候,有不同照片,不同光照不同表情的照片。可以足够代替整个统一人脸模式的变化,你自己的内类变化也能被训练出来的内类变化所涵盖。

提问:你们采用技术是先在离线状况下把模型提取出来,用我的人脸套用在这个模型上进行识别。

刘海龙:对,只能采用这个方法,在线用户图象肯定不够,只有一两张,必须靠离线样本。

提问:我是自动化所的,有一个小想法,咱们有训练样本,那么大,没有办法想去模拟一些训练样本。

刘海龙:可以,有一些虚拟样本可以做,但这是虚拟,但你没有真实样本的情况下可以采用这个路。

提问:我有一个想法,现在三维摄像,能不能用生物技术去模拟人脸表情变化得到一个样本去做训练样本。

提问:我是优酷,腾讯两位嘉宾两个小问题,一个是人脸识别方面,腾讯有没有在姿态校正、眼镜摘除、ASM这种应用对人脸算法有改善,有这个的话改善效果怎么样?

第二个问题,现在图象模式识别方面非常大,腾讯有没有做图象模式识别方面实践。

刘海龙:ASM这块有一些业务需要这些算法和这些模型,比如我们QQ秀,用户上传图象之后把真脸部分扣出来给你一个卡通脸,需要对脸定位,需要用ASM这方面算法。我们跟清华大学合作,我们自己也积累技术,也要改进这部分的技术,定位更好,也会促使我们业务往前发展。

眼镜摘除我们还没有这部分的工作,浅色眼镜影响很小,对人脸识别比较大还是黑框眼镜,对人脸改变比较多,很容易错。这方面技术我们没有做。

提问:我之前没有做过模式识别的东西,听了各位嘉宾演讲,模式识别系统可以理解成抽象特征级的系统,有一些数据输入进来进行学习。在识别的时候给一个数据进来。一个这样通用的模式识别简单系统这样是不是可行?特征值需要自己定义,剩下里边提供一些抽象算法来,自己把这些特征值如何运算,告诉系统,系统进行运算,得出一个结果。


  推荐阅读

  许鞍华: “人到老年可以是另外一种状态”

第一财经日报:《桃姐》乍一看很像纪录片,余力为的摄影也很朴实无华。采用这样的方式,是不是为了凸显情感的真实性? 许鞍华:主要是因为可以拍得很快,而且便于抓拍到养老院当时的状况和其他老人的反应。剧组拍摄的>>>详细阅读


本文标题:腾讯研究院刘海龙:当模式识别遇上云计算

地址:http://www.lgo100.com/a/kandian/20120305/36909.html

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度