QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

2018 年最值得关注的 10 个机器学习开源项目

  • 2018-12-20
  • 本文字数:1865 字

    阅读完需:约 6 分钟

2018年最值得关注的10个机器学习开源项目

顶级开源项目

先让我们看看今年的一些顶级开源项目。

BERT

BERT 是 Bidirectional Encoder Representations from Transformer 的缩写,一种解决自然语言处理问题的新方法,可以获得最先进的处理结果。它是基于 TensorFlow 的,开发人员可以使用预先训练的模型来解决问题。BERT 模型比其他模型具有很大的优势,因为它们可以识别句子的上下文。这个项目目前在 Github 上有 8841 个 star 和 1560 个 fork。


BERT 项目地址:


https://github.com/google-research/bert


论文:


https://arxiv.org/abs/1810.04805

DeepCreamPy

这是一个深度学习工具,可以像图像编辑工具一样重建图像缺失的区域。用户使用图像编辑工具将图像的缺失区域绘成绿色,神经网络则负责给这些区域填充内容。这个项目目前在 GitHub 上有 6365 个 star 和 613 个 fork。


项目地址:


https://github.com/deeppomf/DeepCreamPy

TRFL

TRFL 的发音与 truffle(松露)相同,可以基于 TensorFlow 开发强化学习代理。


项目地址:


https://github.com/deepmind

Horizon

Horizo​​n 是一个用于应用强化学习的平台。Horizo​​n 使用 PyTorch 构建,并使用 Caffe2 来提供模型服务。Horizo​​n 的一个主要优势是在设计时就考虑到了生产环境的使用场景。


项目地址:


https://github.com/facebookresearch/Horizon

DeOldify


DeOldify,顾名思义,是一个深度学习库,用于恢复老照片,并给它们着色。库的作者结合了几种方法来实现这一目的,比如 Self-Attention Generative Adversarial Networks(https://arxiv.org/abs/1805.08318)、Progressive Growing of GANs(https://arxiv.org/abs/1710.10196),以及Two Time-Scale Update Rule(https://arxiv.org/abs/1706.08500)。


项目地址:


https://github.com/jantic/DeOldify

AdaNet

AdaNet 是一个基于 TensorFlow 的库,可以自动学习模型而无需大量专家干预。这个项目基于 AdaNet 算法(http://proceedings.mlr.press/v70/cortes17a.html)。


项目地址:


https://github.com/tensorflow/adanet

Graph Nets


Graph Nets 是 DeepMind 推出的一个库,用于在 Sonnet 和 TensorFlow 中构建图网络。图网络将图作为输入,并返回图作为输出。


项目地址:


https://github.com/deepmind/graph_nets

Maskrcnn-benchmark

在使用 PyTorch 构建对象检测和分割工具时,这个项目可以帮上忙。这个库的优点是速度快、内存占用低、多 GPU 训练和推理,并为推理提供 CPU 支持。


项目地址:


https://github.com/facebookresearch/maskrcnn-benchmark

PocketFlow


PocketFlow 是一个加速和压缩深度学习模型的框架。它解决了大多数深度学习模型的高计算成本问题。它最初由腾讯 AI 实验室的研究人员开发。


项目地址:


https://github.com/Tencent/PocketFlow

MAMEToolkit

MAMEToolKit 是一个用于训练街机游戏强化学习算法的库。这个工具包可以在跟踪游戏状态的同时接收游戏帧数据。


项目地址:


https://github.com/M-J-Murray/MAMEToolkit

ML 框架的主要进展

现在让我们来看一下主要机器学习框架的一些进展。

PyTorch 1.0

在 10 月份的 PyTorch 大会期间,Facebook 发布了 PyTorch 1.0 预览版。新版本将解决以下一些挑战:耗时的训练、大量的网络、缓慢的规模扩展以及 Python 编程语言带来的一些不灵活性。


新版本引入了一组编译器工具(Torch.jit),它们将弥合生产阶段和研究阶段之间的差距。Torch.jit 包含了一门称为 Torch Script 的语言,它是 Python 的一个子集。模型可以从 eager 模式转到 graph 模式。这对于开发高性能和低延迟的应用程序来说非常有用。

Auto-Keras

你可能已经听说过自动机器学习这个概念。从本质上讲,就是自动搜索机器学习模型的最佳参数。其他自动化 ML 框架还包括谷歌的 AutoML。Auto-Keras 是使用 Keras 和 ENAS(神经架构搜索的最新版本)开发的。

TensorFlow Serving

TensorFlow Serving 是一个使 TensorFlow 模型更容易部署到生产环境的系统。TensorFlow Serving 是在 2017 年发布的,在部署模型到生产环境方面,它已经帮助开发人员简化了大量工作。

机器学习 Javascript

有一些 Javascript 框架允许开发人员在浏览器上运行机器学习模型。这些框架包括 TensorFlow.js 和 Keras.js。这些模型的实现与使用 Keras 或 TensorFlow 等常规框架非常相似。

展望未来

2019 年,随着 Auto-Keras 等自动化工具的进步,我们可以期待开发人员的工作变得更轻松。随着研究的进展和开源社区的贡献,我们还可以期待各种机器学习框架的性能得到提升。


英文原文:


https://heartbeat.fritz.ai/2018-year-in-review-machine-learning-open-source-projects-frameworks-430df2fe18cd


2018-12-20 08:053528
用户头像

发布了 731 篇内容, 共 454.9 次阅读, 收获喜欢 2003 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

艾媒咨询 | 2023年中国信创产业发展白皮书

亚信AntDB数据库

数据库 AntDB AntDB数据库

详解RocketMQ 顺序消费机制

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

火山引擎DataLeap的Catalog系统搜索实践(一):背景与功能需求

字节跳动数据平台

软件设计中你考虑过重试了吗?

做梦都在改BUG

Java 软件设计 重试机制

基于 Log 的通用增量 Checkpoint

Apache Flink

大数据 flink 实时计算

MegEngine 使用小技巧:如何解读 MegCC 编译模型几个阶段 Pass 的作用

MegEngineBot

深度学习 编译器 MegEngine Pass

「ACL 2023」:火山语音团队多篇论文中选,涉多方向技术创新突破

科技热闻

开源边缘计算项目【FabEdge v0.8.0】配置connector公开端口操作说明

BoCloud博云

边缘计算 容器网络 FabEdge #开源项目体验 边缘网络

探索 PlanetIX:解读区块链游戏运营的奥秘

Footprint Analytics

区块链游戏 web3 Planet IX

旅游景区如何寻找共享电单车厂家

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电动车投放 景区共享电动车

商业地产研策如何搜集数据​

MobTech袤博科技

阿里P8大佬的1800页计算机基础知识总结与操作系统,太强了!

做梦都在改BUG

Java 程序员 操作系统

精准快速搜索文件:Find Any File 激活版

真大的脸盆

Mac 办公效率 文件搜索 搜索工具 搜索文件

空降攻略!一文带你玩转2023开放原子全球开源峰会

开放原子开源基金会

开源 开放原子开源基金会 攻略 开放原子全球开源峰会

阿里一面凉凉,幸获内推华为技术四面,offer到手!

程序知音

Java java面试 Java进阶 八股文 Java面试八股文

内核调试环境搭建

郑州埃文科技

网络安全 网络环境

财务标准化建设进程中,财务共享能起到什么作用?

用友BIP

财务共享

牛客网 2023 最新 1100道 Java 面试题来袭,面面俱到,太全了!

架构师之道

java面试

艾媒金榜|2023年中国信创企业百强榜

亚信AntDB数据库

数据库 AntDB AntDB数据库

ScaleFlux企业级SSD通过VMware IOVP认证

ScaleFlux

vmware 固态硬盘 企业SSD 存储解决方案

用友BIP新一代全球司库,重塑企业资金管理新价值

用友BIP

全球司库

线程池是如何执行的?任务太多会怎样?

做梦都在改BUG

Java 线程池

Hybrid Shuffle 测试分析和使用建议

Apache Flink

大数据 flink 实时计算

狂刷三遍398道java最新MySQL笔记后,我四面阿里研发部,成功定级P7

做梦都在改BUG

Java MySQL 数据库

今天又和Redis超时杠上了

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

如何用ReadWriteLock实现一个通用的缓存中心?

华为云开发者联盟

Java 开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

财务共享五大价值助力央企构建世界一流财务管理体系

用友BIP

财务共享

电商行业实践专栏上线|阿里巴巴风控实战如何解决大规模风控的技术难点?

Apache Flink

大数据 flink 实时计算

如何进行存储容量规划?

ScaleFlux

存储成本 数据压缩 企业级SSD NVMeSSD

活动回顾丨首期阿里云 Serverless 技术创新实战营上海开讲(含 PPT 下载)

Serverless Devs

2018年最值得关注的10个机器学习开源项目_AI&大模型_Derrick Mwiti_InfoQ精选文章