2011年4月1日下午,来自清华大学信息学院的莘莘学子,CSDN,《程序员》杂志等社会IT界各精英汇集FIT楼多功能报告厅,共同聆听了海外名师的演讲。今天做客清华大学海外名师讲堂第98期的是世界知名数据库专家、Yahoo Labs首席科学家Raghu Ramakrishnan,他带来的演讲题目是”Cloud Computing @ Yahoo!”,本次演讲由清华大学国际合作与交流处主办,清华大学软件学院,Beijing Yahoo! Global R&D Center, Yahoo! Labs Beijing 共同协办。出席本次名师讲堂的还有清华大学信息学院院长、软件学院院长、中国工程院院士孙家广教授。
讲堂由清华大学软件学院党委书记,博士生导师王建民教授主持。首先他代表清华大学感谢Ragh访问清华大学,并简单介绍了Raghu的研究背景,学术经历,取得的重大学术成果及获得的众多殊荣。随后,孙家广院士向Raghu颁发了清华海外名师讲堂的名师奖牌。

接下来,Ragh详细地向大家介绍了雅虎的云计算,特别是数据管理方面的一些工作。云计算自从2006年底被提出,就是一个全球IT界争相热议的话题,许多研究机构、各大企业也都争相对云计算展开了研究和开发。Ragh首先介绍了云计算在雅虎的应用领域,包括雅虎门户中的雅虎搜索引擎索引,雅虎广告,图像,邮件及网络查询。接着他分析了支撑这些云计算应用的相关专业方向,包括内容优化(Content Optimization For Portals)和信息抽取等。他重点谈及了云计算基础设施在数据分析、数据仓库及服务中的使用。Ragh具体地以云环境的offline modeling及online learning的数据管理为上下文,介绍了雅虎正在使用的两个主要系统,即Hadoop Map-Reduce系统及PNUTS/Sherpa存储系统。由于Hadoop是被广泛使用众所周知的含Map-Reduce接口的分布式文件系统开源实现,而雅虎在这个开源项目中是主要的贡献源,在雅虎内部也广泛地使用Hadoop。因此Ragh仅仅对Hadoop作了简单的介绍,而重点详细地描述了Hadoop在雅虎内部的使用情况。
Ragh详细地阐述了雅虎开发的一个叫Sherpa(PNUTS)的数据服务存储系统,用于支持数据支撑型互联网应用。Ragh通过生动的例子,详细地探讨了构建像云服务这样的系统,向开发者提供弹性数据服务能力,以及恰当地平衡一致性、可用性、性能和网络分区中的挑战。在一个半小时的时间里,Ragh分享了Yahoo在云计算的研究及云计算的实战经验,让在座的众多学生及社会各界相关研究领域的IT精英们获益良多。

在提问环节中,大家踊跃地向Ragh提出了自己在研究过程中遇到的疑惑,问题既有通俗性的概念普及,也有技术细节实现问题。最后,王建民教授向Ragh提了一个在座学生都非常关心的很切身的问题:“学生应该如何在在校期间为将来的工作及职业生涯作好规划?”Ragh非常简洁概括地讲了自己多年来的切身体会:Find good cooperate to work with, a good colleague, etc. Learn From Good People and Work With Good People(向好的人学习,与好的人工作)赢得了在场的热烈掌声。

报告厅座无虚席,大家多为信息处理,数据库方向的老师学生及IT人士,由于自身研究方向与Ragh的研究经历息息相关,因此能参加此次海外名师讲堂,大家都倍感荣幸。演讲结束后,很多同学久久不肯离去,与Ragh继续交谈心得与困惑,Ragh也耐心且认真地听取了大家的每一个问题与疑惑,尽其所能地为每一个热心的学生及IT人士指点迷津。最后,王建民教授等和Ragh进行了合影留念。Ragh也在名师的签名簿上留下了自己对清华大学即将迎来的百年校庆的美好祝福。

Raghu Ramakrishnan是雅虎查询与云平台方向的首席科学家,同时也是雅虎的院士,领导着互联网信息管理研究组。他在数据库系统方向的工作专注于数据挖掘、查询优化和互联网规模的数据管理,其成果影响了商用数据库系统的查询优化实现以及SQL:1999标准的窗函数设计。他关于Birch聚类算法的论文 获得了数据管理领域顶级会议SIGMOD的“10年时间考验”奖。他与Johannes Gehrke一同撰写的教材“数据库管理系统”受到了广泛采用。他目前的学术兴趣为云计算、内容优化,以及使用含丰富语义的术语来索引互联网所有信息的 “概念网”开发。Ramakrishnan曾屡获殊荣,包括ACM SIGKDD创新奖、ACM SIGMOD贡献奖、印度理工学院马德拉斯分校(IIT-Madras)杰出校友称号、帕克基金奖(Packard Foundation Fellowship)、美国国家科学基金会(NSF)授予青年科学家的最高奖“青年研究者总统奖”(NSF Presidential Young Investigator Award)。他是ACM和IEEE的双院士。此外,他还是ACM SIGKDD指导委员会成员,曾任ACM SIGMOD的主席及VLDB基金董事会成员。他曾任美国威斯康星大学麦迪逊分校的计算机系教授。他曾参与创建QUIQ公司,并担任CTO——QUIQ公司是众包(crowd-sourcing),尤其是问答社区的引领者,其技术支撑了Ask Jeeves’ AnswerPoint网站以及康柏等企业的客服系统的运行。