在过去的一年里,我们比较了近 22000 个机器学习开源工具和项目,选出了前 49 个(约占 0.22%)。
这些工具和项目分为 6 个类别,如下:
计算机视觉(1~5)
强化学习(6~13)
自然语言处理(14~20)
生成对抗网络(21~26)
神经网络(27~35)
工具包(36~49)
这是一份极具竞争力的列表,它精心挑选了 2018 年 1 月到 12 月发布的最佳开源机器学习资源。Mybridge AI 通过考虑受欢迎程度、参与度和回头率来评估质量。为了让你对质量有直观的了解,Github 上⭐平均颗数是 3566。
带有目录的文本版本请访问 Github:https://github.com/Mybridge/amazing-machine-learning-opensource-2019
2018 年度热门机器学习年度文章请访问:https://medium.mybridge.co/learn-machine-learning-from-top-50-articles-for-the-past-year-v-2019-15842d0b82f6
2017 年度热门机器学习开源资源(该博文在 Medium 上有 21000 个赞)请访问:https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7
对程序员来说,开源项目非常有用。给你足够的时间让你去尝试过去一年里可能错过的机器学习开源项目。
学习建议
A)初学者:Python 下的机器学习、数据科学和深度学习。TensorFlow 和神经网络(http://bit.ly/2FbgIcv)
【84632 个推荐,4.5/5 ⭐】
B)高阶:Python 深度强化学习(http://bit.ly/2DQxHjq)
【20396 个推荐,4.6/5 ⭐】
计算机视觉
【No 1】Detectron:
用于对象检研究的 FAIR 研究平台,实现了 Mask R-CNN、RetinaNet 等流行算法。
【在 Github 有 18913 颗⭐】
地址:
【No 2】Openpose:
用于身体、面部和手部的姿态估计的实时多人关键点检测库。
【在 Github 有 11052 颗⭐】
地址:
【No 3】DensePose:
一种将 2D RGB 图像中所有人类像素映射到基于 3D 表面的人体模型的实施方法。
【在 Github 上有 4156 颗⭐】
地址:
【No 4】Maskrcnn-benchmark:
Pytorch 中语义分割和对象检测算法的快速模块化参考实现。
【在 Github 上有 3888 颗⭐】
地址:
【No 5】SNIPER:
一种高效的多尺度对象检测算法。
【在 Github 上有 1963 颗⭐】
地址:
https://github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
强化学习
【No 6】Psychlab:
使用 Psychlab 平台(基于智能体人工智能的 3D 平台)实现的实验范例。
【在 Github 上有 5595 颗⭐】
地址:
【No 7】ELF:
一个广泛的、轻量级的、灵活的游戏研究平台。我们用它创建了围棋游戏机器人 ——ELF OpenGo,以 14:0 的比分击败了全球前 30 名棋手中的四名。
【在 Github 上有 2406 颗⭐】
地址:
https://github.com/pytorch/elf?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 8】TRFL:
一个有用的构件块库,用于编写 TensorFlow 中的增强学习智能体。
【在 Github 上有 2312 颗⭐】
地址:
https://github.com/deepmind/trfl?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 9】Horizon:
第一个面向大规模产品和服务的开源强化学习平台。
【在 Github 上有 1703 颗⭐】
地址:
【No 10】Chess-alpha-zero:
通过 Alpha Zero 方法进行国际象棋强化学习。
【在 Github 上有 1307 颗⭐】
地址:
【No 11】Dm_control:
DeepMind 控制套件和控制包。
【在 Github 上有 1231 颗⭐】
地址:
https://github.com/deepmind/dm_control?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 12】MAMEToolkit:
街机游戏强化学习 Python 库。
【在 Github 上有 437 颗⭐】
地址:
https://github.com/M-J-Murray/MAMEToolkit?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 13】Reaver:
模块化深度强化学习框架。专注于星际争霸 II。支持 Gym、Atari 和 MuJoCo。匹配参考结果。
【在 Github 上有 355 颗⭐】
地址:
https://github.com/inoryy/reaver?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
自然语言处理
【No 14】Bert:
为 BERT 提供 TensorFlow 代码和预训练模型。
【在 Github 上有 11703 颗⭐】
地址:
https://github.com/google-research/bert?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 15】Pytext:
基于 PyTorch 的自然语言建模框架。
【在 Github 上有 4466 颗⭐】
地址:
【No 16】Bert-as-service:
由 Google 开发的用于预训练语言表示的 NLP 模型。它利用了网上公开提供发的大量纯文本数据,并以无人监督的方式进行训练。
【在 Github 上有 2055 颗⭐】
地址:
【No 17】UnsupervisedMT:
基于短语和神经无监督机器翻译 ——来自 Facebook 研究。
【在 Github 上有 1068 颗⭐】
地址:
【No 18】DecaNLP:
自然语言十项全能:面向销售队伍的 NLP 多任务挑战。
【在 Github 上有 1648 颗⭐】
地址:
https://github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 19】Nlp-architect:
Intel 人工智能实验室的 NLP 架构师:用于探索最先进的深度学习拓扑和技术的 Python 库。
【在 Github 上有 1751 颗⭐】
地址:
【No 20】Gluon-NLP:
使 NLP 变得容易使用。
【在 Github 上有 1263 颗⭐】
地址:
https://github.com/dmlc/gluon-nlp?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
生成对抗网络
【No 21】DeOldify:
基于深度学习的项目,用于着色和恢复老照片。
【在 Github 上有 5060 颗⭐】
地址:
https://github.com/jantic/DeOldify?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 22】Progressive_growing_of_gans:
渐进式增长的生成对抗网络,可以提高质量、稳定性和变异性。
【在 Github 上有 4046 颗⭐】
地址:
【No 23】MUNIT:
多模态无监督图像到图像转换。
【在 Github 上有 1339 颗⭐】
地址:
https://github.com/NVlabs/MUNIT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 24】Transparent_latent_gan:
使用有监督学习来阐明 GAN 的潜在空间,以进行受控生成和编辑。
【在 Github 上有 1337 颗⭐】
地址:
【No 25】Gandissect:
基于 pytorch 的工具,用于可视化和理解 GAN 的神经元。
【在 Github 上有 1065 颗⭐】
地址:
https://github.com/CSAILVision/gandissect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 26】GANimation:
从一张图像中感知具有解剖学意义的面部动画。
【在 Github 上有 869 颗⭐】
地址:
神经网络
【No 27】Fastai:
它使用现代最佳实践简化了快速准确的神经网络训练。
【在 Github 上有 11597 颗⭐】
地址:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 28】DeepCreamPy:
用深度神经网络去除成人漫画的马赛克。
【在 Github 上有 7046 颗⭐】
地址:
https://github.com/deeppomf/DeepCreamPy?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 29】Augmentor v0.2:
用于机器学习的 Python 图像增强库。
【在 Github 上有 2805 颗⭐】
地址:
https://github.com/mdbloice/Augmentor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 30】Graph_nets:
在 TensorFlow 中构建图网。
【在 Github 上有 2723 颗⭐】
地址:
https://github.com/deepmind/graph_nets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 31】Textgenrnn:
Python 模块,可使用预训练的基于字符的递归神经网络轻松地生成文本。
【在 Github 上有 1900 颗⭐】
地址:
https://github.com/minimaxir/textgenrnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 32】Person-blocker:
使用预训练的神经网络自动 “屏蔽” 图像中的人(如英国独立单元剧《黑镜》(Black Mirror))。
【在 Github 上有 1806 颗⭐】
地址:
【No 33】Deepvariant:
Deepvariant 是一个分析管道,使用深度神经网络调用来自下一代 DNA 测序数据的遗传变异。
【在 Github 上有 1502 颗⭐】
地址:
https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 34】Video-nonlocal-net:
用于视频分类的非本地神经网络。
【在 Github 上有 1049 颗⭐】
地址:
【No 35】Ann-visualizer:
用于可视化人工神经网络(Artificial Neural Networks ,ANN)的 Python 库。
【在 Github 上有 922 颗⭐】
地址:
工具包
【No 36】Tfjs:
一个 WebGL 加速的、基于浏览器的 JavaScript 库,用于训练和部署机器学习模型。
【在 Github 上有 10268 颗⭐】
地址:
https://github.com/tensorflow/tfjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 37】Dopamine:
Google 出的强化学习算法快速原型化的研究框架。
【在 Github 上有 7142 颗⭐】
地址:
https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 38】Lime:
解释任何机器学习分类器的预测。
【在 Github 上有 5173 颗⭐】
地址:
https://github.com/marcotcr/lime?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 39】Autokeras:
一种用于自动机器学习(AutoML)的开源软件库。
【在 Github 上有 4520 颗⭐】
地址:
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 40】Shap:
使用期望值和 Shapley 值解释任何机器学习模型的输出。
【在 Github 上有 3496 颗⭐】
地址:
https://github.com/slundberg/shap?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 41】MMdnn:
一套用于帮助用户在不同深度学习框架之间进行互操作的工具。例如模型转换和可视化。在 Caffe、Keras、MXNet、TensorFlow 之间进行转换模型。
【在 Github 上有 3021 颗⭐】
地址:
https://github.com/Microsoft/MMdnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 42】Mlflow:
用于机器学习生命周期的开源平台。
【在 Github 上有 3013 颗⭐】
地址:
https://github.com/mlflow/mlflow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 43】Mace:
用于移动异构计算平台优化的深度学习推理框架。
【在 Github 上有 2979 颗⭐】
地址:
https://github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 44】PySyft:
用于安全、私密的深度学习的 Python 库。PySyft 使用 PyTorch 的多方计算(Multi-Party Computation,MPC)将私有数据从模型训练中分离出来。
【在 Github 上有 2595 颗⭐】
地址:
https://github.com/OpenMined/PySyft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 45】Adanet:
具有学习保证(learning guarantees)的快速灵活的 AutoML。
【在 Github 上有 2293 颗⭐】
地址:
https://github.com/tensorflow/adanet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 46】Tencent-ml-images:
最大的多标签图像数据库;ResNet-101 模型;ImageNet 上的 80.73% 的 top-1 acc。
【在 Github 上有 2094 颗⭐】
地址:
【No 47】Donkeycar:
开源软硬件平台,打造小型自动驾驶汽车。
【在 Github 上有 1207 颗⭐】
地址:
https://github.com/autorope/donkeycar?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 48】PocketFlow:
自动模型压缩框架(Automatic Model Compression,AutoMC),用于开发更小、更快的人工智能应用。
【在 Github 上有 1677 颗⭐】
地址:
https://github.com/Tencent/PocketFlow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 49】DALI:
包含高度优化的构件块和用于深度学习应用中的数据预处理的执行引擎的库。
【在 Github 上有 1013 颗⭐】
地址:
https://github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
以上就是 2018 年度的机器学习教程的全部内容。如果你喜欢这份报道,请阅读更多由 Mybridge 排名的博文:https://medium.mybridge.co/
原文链接:
评论