2020年11月16日下午,清华大学大数据研究中心在FIT楼多功能厅面向全校师生举办首期学术大讲堂,邀请清华大学杰出访问教授、中国科学院樊文飞院士作题为《大规模图数据分析:挑战与机遇》的学术报告。大数据研究中心副主任,软件学院院长王建民主持本次活动。
樊文飞院士在报告中深入浅出地介绍了他近年来在大规模图数据相关的理论与系统方面的研究工作成果。他从大数据的4个V特性出发,分析了大数据领域若干待解决的核心理论与系统问题,表示并不赞同大数据领域以应用研究为主的观点。接着,樊院士围绕大规模图数据从数据规模、到数据多样性,到数据变化性、到数据可用性,四个维度上存在的理论与系统问题介绍了自己的研究思路和取得的丰硕成果。
樊院士首先抛出“并行处理是否足以应对大图数据的分析要求?”“是不是机器越多处理的速度就越快?”等问题,然后介绍了他为提升大规模图数据的并行处理效率,而提出的自适应异步并发算法,以及如何基于有限的计算资源来支持对大图的查询的工作。为应对分析需求的频繁变化,樊院士提出一套科学系统的方法来支持增量算法的研发。针对数据的多样性问题,他提出了为关系型数据和图数据提供统一的基于SQL的查询入口的方法。针对数据的质量与价值问题,他将基于逻辑规则和机器学习模型的方法整合起来,有效支持图数据的质量提升。
樊院士的精彩报告引起了在场广大师生的热烈反映和共鸣,计算机系周立柱教授与樊院士讨论了将图数据转化为关系型数据进行查询的可能性与存在的主要问题。王建民教授就图数据前处理的代价问题与樊院士进行了讨论。软件学院博士生孙宇、康荣、康瑞等分别就时序数据的质量分析的效用等问题请教了樊院士。

来自软件学院、计算机系、自动化系、化工系、建筑学院、核研院、工业工程系、数学系、电子系、能动系、公共管理学院、物理系、电机系、环境学院、国研中心、教研院、航院、经管学院、材料学院、网研院、土木系、卫健学院、燃烧中心、低碳能源实验室等20多个院系及研究团队的70余位师生参加了报告会。
为促进我校在大数据研究领域的交流和合作,大数据研究中心将面向全校师生陆续推出大数据领域的学术大讲堂系列活动。
樊文飞院士,现任英国爱丁堡大学信息学院主任教授,中国科学院外籍院士, 英国皇家学院士、 欧洲科学院院士、英国爱丁堡皇家学会院士、美国计算机协会会士(ACM Fellow)。清华大学杰出访问教授。毕业于北京大学(本科,硕士)和美国宾夕法尼亚大学(博士),任职爱丁堡大学前为美国贝尔实验室科学家。曾获得英国皇家学会Wolfson研究成果奖 (2018)、欧洲研究委员会ERC Advanced Fellowship (2015)、 英国 Roger Needham 奖(2008)、中国长江学者 (2007), 海外杰出青年学者(2003)、美国 CAREER Award(2001), Elsevier网络科学刊物年度最佳论文和最杰出作者奖(2002)以及数据管理四大国际顶级理论与系统会议的时间检验奖和最佳论文奖: Alberto O. Mendelzon时间检验奖/ACM PODS十年最佳论文奖 (2010和2015), ACM SIGMOD (2017)、VLDB(2010)和 ICDE(2007)最佳论文奖。 目前主要研究领域为数据库理论与系统,包括大数据、数据质量、分布式计算、查询语言、推荐系统和社会网络精准营销。

供稿:刘璘
审核:王建民