百度陈尚义:百度新存储系统应对大数据挑战

作者:Lgo100 来源:未知 2012-05-28 20:08:57 阅读 我要评论 直达商品

百度技术委员会理事长陈尚义

【TechWeb报道】5月28日消息,近日,百度技术委员会理事长陈尚义应邀出席第四届中国云计算大会“云计算与大数据专题论坛”。同时出席论坛的还有电子学会名誉理事长、原信息产业部部长吴基传,中国电子学会副理事长刘汝林,北航计算机学院院长吕卫锋等产业界高端专家、学者。

陈尚义在论坛上作题为“百度大数据挑战及应对”的主题演讲,从百度的数据特点及对存储系统的要求出发,介绍了百度存储系统的先进性。

“百度储存和处理的数据主要包括:网页和超链的数据量、日志、数据仓库、广告数据、UGC(用户创造的数据)” 陈尚义绍了百度的数据特点,并用“海量”和“复杂”来形容百度数据特点。“百度拥有的数据总量上百PB,日处理量达几十PB,且呈现高速增长的态势。而且,这些数据的特点是,结构化与非结构化并存,系统数据对数据一致性要求强弱程度不同,用户对数据的访问行为存在不确定性,即在毫无征兆的情况下,对某些信息进行突发式访问等。这些特点使得百度要应对复杂的存储要求。”

如何应对这样的挑战,陈尚义通过解析百度的云储存架构及优势,为与会嘉宾解开了疑惑。其中,陈尚义特别指出,百度对存储系统做了全局优化,包括针对访问模式的优化、针对硬件特性的优化、依访问模式定制硬件、提升单机性能、与CDN系统实现更优结合。

“比如,在硬件特性优化方面,百度对单机的硬件(CPU、内存、硬盘、SSD等)进行合理配比,以实现单机资源的充分利用。”陈尚义解释说,“又如,在与CDN系统实现更优结合方面,百度将最常被访问的数据自动缓存到距离用户最近的数据中心。”

在介绍百度储存优势时,陈尚义还介绍了李彦宏发明的超链分析技术。“这一技术早在1999年就被授予了专利,比Google创始人佩奇申请的Pagerank专利还早,是搜索引擎产业发展的基石。原中国计算机学会理事长、中国工程院院士李国杰先生称赞‘李彦宏在推动计算技术和产业的发展中做出了可载入史册的历史性贡献’。”


  推荐阅读

  雷士照明创始人吴长江辞职 传因投资人夺权

雷士照明(02222.HK)上周五发公告称原董事长兼首席执行官吴长江辞去全部职务,股价盘中大跌三成。吴长江的突然离开,有坊间传闻是其与投资人矛盾激化被逼宫的结果。 昨天《第一财经(微博)日报》记者试图联系赛富基金管>>>详细阅读


本文标题:百度陈尚义:百度新存储系统应对大数据挑战

地址:http://www.lgo100.com/a/43/20120528/63836.html

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
我的评论: 人参与评论
验证码: 匿名回答
网友评论(点击查看更多条评论)
友情提示: 登录后发表评论,可以直接从评论中的用户名进入您的个人空间,让更多网友认识您。
自媒体专栏

评论

热度