最近, Linguist 项目统计了代码托管网站 GitHub 上各类编程语言的热度。下图展示了自 2008 年以来各编程语言的排名状况及它们的相对热度。
从上图中可以看出,Perl 已经不再流行,C#开源之后流行度迅速上升,JavaScript 高居榜首,Java 则一路攀升至第二名,“最好的语言”PHP 没有变化。 GitHub 的 Ben Balter 说,十年前 Java 是一个闭源开发的语言,银行和企业用来开发应用;如今 Java 是构建开源软件的最流行语言之一。Balter 认为,Java 的崛起是 Google 选择用它构建 Android 的结果。作为当今智能手机最广泛使用的操作系统 Android 的兴起使得 Java 开发者增多,同时企业里对版本控制平台的需求大大增加,这些因素都可能促成了现在这样的结果。
这个排名是基于 GitHub 上公共和私有库使用的语言及其创建时的年份统计的,该排名并没有统计分支中的情况。由于没有统计每一个仓库中的分支,统计得到的数据并不是各种语言的使用总量。另外,这种方法没有对统计对象进行加权,比如说,GitHub 上有相当多不同语言的 Hello World 项目仓库,它们之所以被创建,仅仅是因为使用者作为新手学习时进行的尝试。如果不把这一类意义不大的仓库剔除,编程语言使用情况的统计结果就会出现偏差。
如果采用加权法对统计进行改进的话,大型项目的权重需要设置得比小型项目的权重更大。这是因为,小型项目(如 batch files、css、html、examples、tests 等)往往约定俗成地使用某一种特定的语言,然而对于大型项目,却有多种语言可以选择。至于实现项目时到底选择哪一种语言,那么就要看程序员的考虑和喜好了,这也才是编程语言使用率统计的重点所在。新创建的(大型)项目相比于过往创建的(大型)项目,其权重也可以更大。将项目的代码行数和创建日期作为加权因子同时在统计中考虑,能够更好地体现各语言的使用率趋势。
感谢魏星对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注 我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。
评论