写点什么

大数据与机器学习周报 第 25 期:谷歌开源大规模语言建模库

  • 2016-09-19
  • 本文字数:1096 字

    阅读完需:约 4 分钟

业界新闻

  1. 谷歌开源大规模语言建模库,探索 RNN 极限:近日,谷歌宣布开源大规模语言建模模型库,这项名为“探索 RNN 极限”的研究今年 2 月发表时就引发激论,如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩,另外开源的数据库含有大约 10 亿英语单词,词汇有 80 万,大部分是新闻数据。这是典型的产业研究,只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样,在机器翻译、语音识别等领域起到推进作用
  2. MIT 最新发布编程语言 Milk,加速大数据时代并行运算:本周 MIT 最新发布新编程语言 Milk,新的程序语言在大数据方面能实现比现有语言快四倍的处理速度
  3. Twitter 开源增强学习框架 Torch-twrl ,可与 OpenAI 无缝对接:借鉴其他的增强学习框架,torch-twrl 希望提供:一个在 Lua/Torch 中的、拥有最小函数依赖的增强学习框架;定义清晰的、模块化的代码带来的快速开发;与 Open AI 的增强学习基准框架 Gym 的无缝对接

技术干货

  1. 从 MySQL 到 Kafka,如何管理每天实时发布的几十亿条消息?:当你的系统每天要实时从 MySQL 到 Kafka 发布几十亿条消息时,你会怎么管理这些数据的模式信息呢?当你的系统要接入几百个服务时,你就要处理几千种不同的模式,手工管理是不可行的。必须有自动化的方案来处理从上游数据源到所有下游消费者的模式改变问题。Confluent 公司的 Schema Registry 和 Kafka Connect 都是不错的选择,可惜当我们开始构建 Yelp 数据管道时它们还没发布。因此就有了我们的 Schematizer
  2. 腾讯亿级排行榜系统实践及挑战:排行榜满足了人的攀比、炫耀心理,几乎每个产品都会涉及。SNG 增值产品部的 QQ 会员、QQ 动漫、企鹅电竞、游戏赛事等大量业务都对排行榜有强烈需求,特别是企鹅电竞等业务的发展壮大对我们排行榜系统提出了更多要求和挑战
  3. 百分点亿级个性化推荐系统的发展历程和实践架构:百分点个性化系统开始于 2009 年,是百分点公司的第一个产品,也是一直延续至今的产品。个性化系统以电商推荐为切入点,涵盖电商、媒体、阅读、应用市场等领域,以第三方技术服务的形式为企业提供个性化推荐服务

深度观点

  1. 深度 | 主流深度学习框架对比:看你最适合哪一款?:近日,Deeplearning4j 在自己的官方网站发表了一篇对比 Deeplearning4j 与 Torch、Theano、Caffe、TensorFlow 的博客文章,同时 Deeplearning4j 在文章中也对自己的框架进行了较为详细的介绍(多有溢美之词)。机器之心对全文进行了编译,文中观点仅代表原作者立场
  2. 郭炜:大数据领域缺的是分析人才:本文嘉宾在智能硬件以及大数据分析领域具有丰富的理论和实践经验,多次在 CIO 论坛、O2O 论坛、创业论坛发表相关演讲,在传统行业和互联网行业享有良好的声誉
2016-09-19 19:002323
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 95464 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

postgresql数据库 timescaledb 时序库 超级表 块的压缩(compress_chunk()的应用)

Yang

数据库 postgresql

一次过透气浆、印一次透气浆

C13713145387

透气胶浆 一次过透气浆

数字资产的发行是全球都无法阻挡的大趋势!

CECBC

数字资产

建筑行业全周期区块链产融平台

CECBC

建筑行业

打破思维定式(二)

Changing Lin

5月日更

OAuth 2.0 与 OIDC

Zhang

OAuth 2.0 OIDC

哑面爽滑肤感胶浆

C13713145387

哑面爽滑肤感胶浆

牛仔底色保护浆(喷砂工艺)

C13713145387

牛仔底色保护浆

爽面弹力胶浆、哑面弹力胶浆

C13713145387

爽面弹力胶浆

区块链与物联网融合发展都会有哪些机遇与挑战

CECBC

区块链

展开说说,Spring Bean IOC、AOP 循环依赖

小傅哥

Java spring 小傅哥 ioc 循环依赖

哑面防水尼龙胶浆Nylon printing paste

C13713145387

哑面防水尼龙胶浆

进击的速溶咖啡:当中国AI开始玩工业化

脑极体

模块三作业:消息队列详细设计文档

薛定谔的指南针

架构实战营

NumPy之:结构化数组详解

程序那些事

Python 数据分析 Numpy 程序那些事

Google官方关闭binary后,Android工程师怎么办?

Changing Lin

5月日更

入门到精通!阿里码农熬了2晚整理的Java工具,真香

飞飞JAva

Java java工具类

4.2 Go语言从入门到精通:延迟函数 defer

xcbeyond

defer Go 语言 5月日更

算法训练营 - 学习笔记 - 第五周

心在飞

自研消息队列架构设计文档

菠萝吹雪—Code

架构实战营

采取有效云网络安全策略的5个基本步骤

云计算

融云亮相 CDEC2021 上海站 全场景通信能力赋能企业数字升级

融云 RongCloud

MySQL数据迁移那些事儿

Simon

MySQL 数据迁移

夏季不塞网胶浆、夏季不堵网胶浆

C13713145387

夏季不塞网胶浆

架构实战营 模块二 作业

Pitt

架构实战营

Golang实现文件复制的技巧

liuzhen007

Go 语言 5月日更

超级全面的测试用例设计,你确定不来看一看?

程序员阿沐

软件测试 测试用例 测试工程师

Java中用户线程和守护线程区别这么大?

王磊

Java 并发编程 多线程 5月日更

Spring-技术专题-设计模式和研究分析

洛神灬殇

spring 设计模式 原理分析 5月日更

网络攻防学习笔记 Day5

穿过生命散发芬芳

5月日更 网络攻防

太简单了!这套Java异常处理的总结,80%的人都没看过

牛哄哄的java大师

Java

大数据与机器学习周报 第25期:谷歌开源大规模语言建模库_大数据_丁涛_InfoQ精选文章