[导读]众所周知,大数据、云计算技术等在近些年的迅猛发展改变了整个互联网业态。随之而来的,是世界范围内的数据科学人才的极大缺口。麦肯锡预测到2018年,美国在“具有深入分析能力的人才”方面可能面临着14万到19万的人才缺口,而“可以利用大数据分析来做出有效决策的经理和分析师”缺口则会达到150万。中国的情况也是如此。在不久前的“中国大数据产业峰会”上,清华大学大数据硕士项目教育指导委员会副主任、计算机系武永卫教授透露了一组数据:未来3至5年,中国需要180万数据人才,但目前只有约30万人。为了应对人才缺口挑战,清华大学在大数据教育上走在了国内教育的前列,率先成立了“数据科学研究院”(以下简称数据院),致力于大数据的科学研究和人才培养。
2014年4月清华大学成立了数据科学研究院,并于同年9月招收了第一批“大数据硕士项目”的研究生。2015年12月4日,清华大学研究生院联合数据科学研究院官方发布 “清华大学大数据能力提升项目”,一经发出反响火爆。截至2016年4月5日,该项目共招收学生共177名,其中硕士89人,博士88人,分别来自学校23个院系。2016年7月,数据科学人才培养平台建设项目获得了“清华大学研究生院工作创新奖”。
那么,
清华的大数据教育的创新之处在哪里?
学科设计是什么样的?
优势和特色是什么?
就业前景如何?
在2016级清华大学大数据人才培养项目报名前夕,我们采访到了清华大学数据科学研究院管委会委员、公管学院孟庆国老师,数据院管委会委员和教育指导委员会委员、交叉学院徐葳老师,数据院俞士纶院长和清华大数据产业联合会会员单位“功典科技”的首席执行官夏雨农。针对大家普遍感兴趣的几个问题,他们分别多角度地阐述了清华大学的大数据研究生教育理念。
对话徐葳老师
徐葳老师曾在Google公司担任软件工程师,入选国家青年千人计划,主要研究方向为分布式系统和大数据系统架构,并担任《大数据系统基础》课程教师。
为什么只招收研究生?
孟庆国老师认为,大数据能力的培养不是单一学科能做好的,应构建多学科综合交叉的教育体系。清华大学的“大数据硕士项目”由校内7院系协作共建,研究生分别来自23个院系,这充分体现了大数据人才培养的多学科综合交叉“格局”。这种“格局”要求学生既要有工程、人文、社科等相关专业学科背景,同时又要有计算科学、信息技术等学科的基础知识。只有这样才能更好地理解大数据的概念、掌握大数据的方法,在与专业的融合中学习和应用好大数据。将来自不同学科的学生吸纳到这个跨学科的人才培养平台上,正式清华大学“大数据硕士项目”的鲜明特色之一。
清华大数据教育的特点是什么?
“让学术更学术、让专业更专业”。俞士纶院长介绍到,数据院创造性的人才培养体现在实行价值塑造、能力培养、知识传授“三位一体”的培养模式,这是清华大数据教育特点。笔者解读:贯彻数据科学研究院“RONG”的理念,不断促进“融合”“ 包容”,实现跨学科、跨领域、跨应用的产学研结合。
以徐葳老师任课的《大数据系统基础》为例,学生存在“众口难调”的情况——他们分别来信息类和非信息类的学生。为此,该课历经两轮创新,变革课堂教学的模式,将信息和非信息类不同学科背景的学生混合编组。每个小组合作完成一个实际的大数据项目。这需要小组成员先了解客户需求、并以此需求提供解决方案,最终实现开发产品的可视化。在此过程中,学生们不仅完成了大数据教学任务,还扩展了跨学科跨领域的知识,培养团队协作能力,“相互学习相互促进,效果非常好”。同时,学生们还可以接触来自业界的真实数据,了解到“这些数据如何对接数据应用场景,从而开发出真正落地的数据产品。”
2015秋季学期《大数据系统基础》结课答辩
清华大数据教育的优势是什么?
从学科建设上,问题引导、社科突破、商科优势、工科整合的学科设计。徐葳老师特别强调说:“我们不是要培养IT supporter。数据科学是一种思维方法,我们更关注于它能否用于解决别的领域的问题”。因此在大数据的课程融合了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系,不在某个技术和算法上发力,而是给学生提供全面的大数据思维能力和实践能力的培养。结合《大数据系统基础》课程教学,徐葳老师透露,今年将更早地向社会开放征集项目和企业导师,已达成上述目标。
孟庆国老师从大数据治理的角度,还分享了《大数据治理与政策》课程的宗旨和目标:让学生能够利用大数据理念和方法,处理公共管理和公共政策中的问题,理解和创新公共管理和公共决策的机制;培养学习者的大数据思维,对大数据推动公共管理变革和创新应用,有更深入的认识和系统的理解;学会应对大数据带来的可能风险、安全及隐私等问题,处理好大数据本身带来的公共治理问题。
孟庆国老师还强调,《大数据治理与政策》的教学将更依赖于案例分析,让学生深度认知大数据治理与政策问题。孟庆国老师也向我们透露,本学期也将开展更多从大数据应用场景出发的“应用·创新”系列讲座,并对全校学生开放。(更多大数据学科介绍,请查询数据科学研究院官网“人才培养”-“教学体系”专题)。
从业界合作上,依托业界联盟。徐葳老师坦言《大数据系统基础》的难点是需要学生与来自业界的“客户” 交流,了解业界的真实需求,用好真实数据。而这些真实需求和真实数据依托的是清华大数据产业联合会的130多家企业和160多位大数据从业者。截止到目前,数据科学研究院已与SAS、IBM、汤森路透、苹果公司、Facebook和Cloudera等多家知名公司建立合作平台。
从科研上,创新为要,协同发力。数据科学研究院成立以来,其推动跨界融合的理念与行动得到了清华大学众多院系的认同与支持。俞士纶院长介绍到,数据科学研究院已与众多院系合作建立了大数据研究中心。(更多可查数据科学研究院官网首页“科研机构”专题)。并产生了初步成果:工业大数据研究中心于2015年4月将开发的平台应用于三一重工装备大数据平台,成功替换Oracle数据库;经济金融大数据研究中心的“清数-银联智策指数”与2015年5月在彭博社(Bloomberg)经济信息终端上线,成为实时研究中国经济的重要指标之一;科技创新大数据研究中心自主研发面向科技大数据深度挖掘的“研究者社会网络挖掘与搜索系统”:Aminer并被微软公司用于科技搜索;遥感大数据研究中心建设了“天地空海数据平台”,部分高分数据产品已经上线,满足清华校内外产学研的长远需求。
如何真正将这门学科落地?就业前景如何?
清华大数据产业联合会会员企业功典科技的CEO夏雨农先生表示,业界对人才的渴求看重两点:技术和态度,在招聘时,会更注重态度的考量。希望招收的学生拥有对不同知识的好奇心和“跨界”、“包容”的态度。以“功典科技”为例,现阶段其发展目标是要落地应用好所积累的数据,需要数据科学人员与前端销售和后端技术支持的融洽配合。高等学府对业界的人才输送目前处于供不应求的状态。但企业在招聘时,会着重考虑学生“看见数据在哪里、数据价值、诠释问题、落地解决”的能力。他建议走技术路线的大数据学生“要明确技术是必须具备的能力,同时提升沟通和理解问题的能力。”,而数据科学研究院通过案例教学、讲座和RONG论坛提供给了学生深刻理解市场痛点的机会,同时通过项目教学锻炼学生的团队协作能力和表达能力,让学生听得懂、正确解读、表达观点。夏总还建议走社科路线的大数据学生在准备职业规划时,要“培养数据思维,充分涉猎统计学科相关知识,树立数据思维观念,由点及面,要能看到全景。”而数据科学研究院合班教学的方式正提供了这样的平台。
专访丨徐至阳、薛娅菲
拍摄丨王君辉
注:来源:自媒体—数据派,转载请注明来源。微信搜索“数据观”获取更多大数据资讯。