对于有志成为数据科学家和大数据参与者的人来说,2013 年里涌现了大量新增的教育机会——新的教学项目、学位和捐赠。
在 2013 年 11 月,白宫科学技术政策办公室公布了一项为期五年、总额3780 万美元的项目,用来推动面向未来科学家们进行推广和普及数据科学和大数据。该项目还在这一领域中处于领先水平的高校之间,创建一套协作框架。这些学校包括纽约大学、华盛顿大学和加州大学伯克利分校。该项目的资金来自摩尔基金会(Moore Foundation)和斯隆基金会(Sloan foundation)。斯隆基金会数字信息技术项目主管Joshua Greenberg,在一篇声明中强调了该项目背后的主要目标,并表示此次合作将试着“转变高校文化,促进大数据科学方面文化的形成”。
参与此次行动的高校,都已经在2013 年的早些时候公布了各自的数据科学项目:伯克利在7 月公布了数据科学在线硕士学位;三月份,纽约大学放出了一则数据科学硕士学位的消息,作为其数据科学中心的一部分,并在9 月份正式启动。随着大数据项目的盛行——例如这个组中的研发团队开发的 Spark ——业界热切渴望着此类才能,并对这些领域未来的毕业生充满了期许。
此外,2013 年的另一个亮点是 MOOC 的流行——这些在线课程吸引了来自不同背景的大量学生——对数据科学家来说,这些在线课程服务提供了许多学习的机会。有志成为数据科学家的人可以通过 MOOC 平台的 Coursera ,访问由华盛顿大学研究主任Bill Howe 讲授的课程,来初步了解这一领域。该课程所涉及的主题,涵盖了数据科学家需要了解的方方面面,从关系型数据库、NoSQLogic、机器学习、MapReduce 和Hadoop,到更加抽象的领域(例如数据可视化)。学生参与该课程的完成率超过了15%(一般MOOC 课程的完成率在10% 以下);同时,在课程论坛上,对该课程的绝大部分反馈也都是积极正面的。由此可见,它非常符合时下对数据科学家的旺盛需求,而且预计还将在今年继续开放。
其他在线大学也已经加入了这个数据科学的潮流中。例如, Udacity 在 11 月与大数据初创公司 Cloudera 开展合作,来提供围绕着大数据的在线数据科学培训。其中的第一项课程是对Hadoop 和MapReduce 的介绍,由Cloudera 的讲师们围绕着关于编写MapReduce 任务并使用HDFS 的实践知识开展教学。在Hadoop 方面,Cloudera 凭借它的流行的Hadoop 发行版和开源项目 Impala ,已经积累了良好的声望和信誉。因此有理由对该培训寄予厚望。尽管完整的课程预计在 2014 年 1 月开始,但感兴趣的人现在就可以注册访问免费课件了。
随着这些新机遇的涌现,围绕着数据科学出现了许多评论。例如纽约的著名数据科学家 Hilary Mason (同时也是 HackNY 的联合创始人),于 11 月在 Twitter 上写道“数据科学是一个不断成长的领域”。在纽约 Strata 2013 上,来自纽约大学数据科学项目主管 Yann LeCun 做了一场演讲,深入探讨了最近数据科学方面的机遇,以及它们如何令数据科学成为 21 世纪最性感的工作之一。
评论