写点什么

2018 年 Github 最受欢迎机器学习语言 Python 稳坐冠军,numpy、scipy 是最受欢迎软件包

  • 2019-01-25
  • 本文字数:1233 字

    阅读完需:约 4 分钟

2018年Github最受欢迎机器学习语言Python稳坐冠军,numpy、scipy是最受欢迎软件包

在 GitHub 2018 年的 Octoverse 报告中,机器学习和数据科学是 GitHub 上的热门话题。其中,tensorflow / tensorflow 是项目贡献最多的项目之一,pytorch / pytorch 是增长最快的项目之一,而 Python 是 GitHub 上第三大最受欢迎的语言。于是,GitHub 决定更加深入地研究一下,机器学习和数据科学在该平台究竟是怎样的情况。


GitHub 提取了 2018 年 1 月 1 日到 2018 年 12 月 31 日之间的贡献数据。这些贡献可能包括推送代码、发起话题或提取请求、评论问题或提取请求,以及审查拉取请求。对于大多数导入的程序包,GitHub 使用了从依赖关系图中获得的数据,其中包括所有公共存储库和已选择加入依赖关系图的所有私有存储库。

机器学习编程语言:Python 稳坐冠军


GitHub 以使用“机器学习”主题标记的存储库的贡献者为依据,对存储库中最常见的主要编程语言进行了排名。结果显示,Python 是机器学习库中最常用的语言,也是 GitHub 上第三种最常用的语言。然而,并非所有机器学习项目都使用 Python:GitHub 上还有其他一些最常见的机器学习通用语言,如 C ++、JavaScript、Java、C#、Shel l 和 TypeScript 跻身 GitHub 编程语言 Top10,同时是机器学习项目的 Top10 语言。Julia、R 和 Scala 都出现在机器学习项目编程语言的前 10 名,但未上榜 GitHub 整体最受欢迎编程语言 Top10。Julia 和 R 都是数据科学家常用的语言,Scala 在 与 Apache Spark 等大数据系统交互时变得越来越常用。

最受欢迎机器学习和数据科学包:numpy、scipy、pandas 占据前三


我们从依赖图中提取数据,以计算导入流行 Python 包的机器学习或数据科学项目的百分比。上表为项目导入最多程序包 Top10 排名。我们发现:


  • Numpy,一个支持多维数据数学运算的软件包,是导入最多的软件包,近四分之三的机器学习和数据科学项目使用此包。

  • Scipy,一个用于科学计算的软件,pandas,一个用于管理数据集的软件包,以及可视化库matplotlib,都在超过 40% 的机器学习和数据科学项目中使用。

  • Scikit-learn 是一种流行的机器学习包,包含大量机器学习算法的实现,近 40% 的项目使用此包。

  • Tensorflow 是一种用于处理神经网络的软件包,近四分之一的项目使用。


前十名中其他的包均为实用程序包:排名第六的是 Python 2 和 3 兼容性库,python-dateutilpytz 是用于处理日期的包。

最受欢迎的机器学习项目:Tensorflow


2018 年,带有“机器学习”标签、贡献最多的开源项目为 Tensorflow,是迄今为止最受欢迎的机器学习项目,且其贡献者数量是第二大受欢迎项目 scikit-learn 的五倍多。排名第三和第九的 explosion/spaCy/ spaCy 和 RasaHQ / rasa_nlu 是两个专注于自然语言处理问题的项目。另外四个项目,CMU-Perceptual-Computing-Lab / openpose,thtrieu / darkflow,ageitgey / face_recognition 和 tesseract-ocr / tesseract 则专注于图像处理。另外,Julia 语言源代码也是 2018 年项目贡献最多的项目之一。


原文链接:


https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/


2019-01-25 12:446738
用户头像

发布了 98 篇内容, 共 65.1 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

使用Spark Mllib进行数据分析

大数据技术指南

大数据 spark 28天写作 3月日更

吐血整理超全Java进阶教程:基础+容器+并发+虚拟机+IO

Java架构之路

Java 程序员 架构 面试 编程语言

浅谈自动化测试

行者AI

自动化测试

Java-技术专题-挖掘陷阱系列(1-10)

码界西柚

Java

为融云聊天页面的输入框添加 Placeholder

融云 RongCloud

挑灯夜战800个小时,终从外包成功上岸字节!入职那一天我眼眶湿润了「Java岗」

Java架构之路

Java 程序员 架构 面试 编程语言

融云的聊天页面在 iOS14 出现崩溃的解决办法

融云 RongCloud

集成融云 IMLib 时,如何实现一套类似于 IMKit 的用户信息管理机制

融云 RongCloud

云通信产品专家翅飞:企业如何提升用户全生命周期管理效率?号码百科来帮忙

阿里云Edge Plus

LeetCode题解:221. 最大正方形,动态规划,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

融云聊天页面长按消息后“翻译”功能的实现方法

融云 RongCloud

filwallet 需求文档-产品训练营大作业

流浪猫

filwallet

实时计算应用及技术选型

五分钟学大数据

大数据 flink 28天写作 3月日更

大作业 1

简简单单

还在计划转Go么,聊聊程序员的成长

架构精进之路

3月日更 Go 语言

使用融云 SDK 避坑指南之 iOS13 推送失败

融云 RongCloud

2021年人工智能产业发展趋势

百度开发者中心

趋势

NAC公链公链未来前景如何?为应用而生的Nirvana NA公链

区块链第一资讯

区块链 公链 挖矿

30 分钟集成融云 IM 即时通讯

融云 RongCloud

如何设置融云用户信息

融云 RongCloud

Java面试“圣经”,已助朋友拿到7个Offer!2021年金三银四面试知识点合集

Java架构之路

Java 程序员 架构 面试 编程语言

最高法两会报告聚焦区块链惩治抄袭,区块链在保护网络著作权方面如何作为?

旺链科技

版权保护 区块链应用

大作业2

简简单单

产品经理大作业

赵志广

产品经理训练营

MMMDeFi智能合约(MDF互助)系统开发方案

薇電13242772558

智能合约 数字货币

产品训练营--大作业

曦语

产品训练营

牛逼了!这是什么神仙面试宝典?半月看完25大专题,居然斩获阿里P7offer

Java 程序员 架构 面试

MySQL要分表分库怎么进行数据切分?

李尚智

Java MySQL

Hystrix技术专题-基础配置说明

码界西柚

Hystrix

2018年Github最受欢迎机器学习语言Python稳坐冠军,numpy、scipy是最受欢迎软件包_编程语言_Thomas_InfoQ精选文章