为了扩大在数据科学界的领地,微软去年冬天收购了Revolution Analytics,一家基于开源项目 R 的计算统计软件和服务主要供应商。该交易预计会将 R 语言的能力带入到微软产品套件中,并且能够促进基于 R 的解决方案在企业环境中的应用。Revolution Analytics 将会继续支持和开发非 Windows 版本的产品并且会继续为开源社区做贡献。
Revolution Analytics 最初作为耶鲁大学的派生公司成立于 2007 年,如今已经成为 R 生态系统的重要支柱。该公司拥有将近 100 名员工,支持遍布世界的大量用户群组,并且为超过 200 个商业用户服务,其中包括 Jonhson & Jonhson,Merck,Pfizer 和 Citigroup 等。此外,Revolution Analytics 在 R 开源社区中的表现也十分抢眼,领导了包括 ParallelR , RHadoop 以及其旗舰产品 Revolution R Open (RRO)在内的许多在建项目。在 2013 年的一次采访中,CEO Dave Rich 提到 SAS 和 SPSS(被 IBM 收购)以及像 KXEN(被 SAP 收购)这样的小公司都是 Revolution Analytics 的主要竞争者。
从技术的角度来说,RRO 是 GNU R 的下游分发产品,在性能和可重现性两方面做出了优化。用英特尔数学内核库( Intel Math Kernel Libraries ,MKL)替代标准的 BLAS/LAPACK 库之后,在性能上,特别是在多核硬件上的性能提升十分显著。尽管对于有经验的开发老手来说,很容易就可以将 GNU R 重新编译并链接到 MKL,RRO 的优势在于以开箱即用的方式提供了这一功能。相比之下,在可重现性方面的优化显得更加独一无二。Revolution Analytics 在 CRAN 库中维护了一套镜像,以确保每个版本的 RRO 都会使用固定版本的包,这样随着时间的变化可以一直提供一致并可重现的结果。
值得注意的是,Revolution Analytics 既没有 R 的所属权也不是 R 的创造者。R 是由奥克兰大学的两位统计学家 Ross Ihaka 和 Robert Gentleman 于 1993 年发起的,目前由非营利组织 R Foundation 管理的自由开源项目。它是贝尔实验室在 70 年代设计的统计计算语言 S 的现代实现之一。另外一个实现 S-PLUS 目前由 TIBCO 维护并销售,并且 TIBCO 拥有该实现的专利。
经过 20 多年的发展,在学术界和工业界,R 拥有大约两百万用户。较为知名的 R 用户包括谷歌、福特、微软、脸书、美国银行、优步、纽约时报以及一部分美国联邦机构。自然杂志在2013 年的一篇报告中提到,在最大的一个同行评议文献目录数据库Elsevier’s Scopus 中索引的学术论文,有将近1% 引用了R 或R 中的一个包。
正如 MWD Advisors 的 IT 行业分析师 Helena Schwenk 所指出,包括 Oracle,IBM,Teradata,Pivotal,SAP HANA 和 SAS 在内的许多软件巨擎都已经拥有了自己的 R 战略。微软仍然处于一个红海市场。[…] Helena 提到,如果微软想要在这一市场有所突破,其首要工作就是阐明其所用的方法的价值以及与其他竞争者之间的差异。
研究公司IDC 预测,高级预测分析软件的市场将从2015 年的26 亿美元增长到2018 年的35 亿美元。Revolution Analytics 获得了3870 万美元的风险投资,据 Wikibon 估算,该公司 2013 年的收入大约为 1200 万美元。
评论