写点什么

大数据与机器学习周报 第 10 期:Twitter Heron 正式开源

  • 2016-05-30
  • 本文字数:1758 字

    阅读完需:约 6 分钟

编者按:本系列周报从第 10 期开始做出重大改版。今后将分为“业界新闻”、“技术干货”和“深度观点”3 大版块。感谢大家一直以来的关注和支持,我们将继续努力为读者奉献高质量的内容。

业界新闻

  1. 《重磅 | Twitter Heron 正式开源》:去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。据文中介绍,Heron 支撑 Twitter 的所有实时分析业务已经有两年多了。它替代了之前使用的 Apache Storm 系统。Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统
  2. 《Spark 2.0 技术预览版正式发布下载》:在过去 Spark 社区创建了 Spark 2.0 的技术预览版,经过几天的投票,目前该技术预览版今天正式公布
  3. 《真正的人工智能?Siri 被曝将迎来革命性更新》:2015 年,苹果(已知)收购了三家与人工智能技术相关的企业,它们分别是 Emotient、Perceptio 和 VocallQ。其中,VocallQ 是一家来自英国的语音识别学习软件公司。除了 Beats 和 Siri 之外,苹果在过去几年所收购的企业似乎都没有什么名气可言。不过在今年的 WWDC 大会上,VocallQ 可能就要大放异彩了

技术干货

  1. 《童有军:怎样进行精准用户画像》:童有君现任 FreeWheel 主任工程师,以下就广告平台中用户画像和标注噪声处理进行先行采访。童表示用户画像在广告平台的应用中与传统电商在定位与需求方面着眼不同。期间谈到 LR 模型拥有两大优点,并表示看好深度学习领域的前景
  2. 《Uber 怎样使用 Spark 和 Hadoop 优化用户体验》:如果你用过 Uber,你一定会注意到它的操作是如此的简单。你一键叫车,随后车就来找你了,最后自动完成支付,整个过程行云流水。但是,在这简单的流程背后其实是用 Hadoop 和 Spark 这样复杂的基础大数据架构来支撑的
  3. 《Spark 性能优化指南——高级篇》:继基础篇讲解了每个 Spark 开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark 性能优化指南》的高级篇,将深入分析数据倾斜调优与 shuffle 调优,以解决更加棘手的性能问题
  4. 《大数据分析界的“神兽”Apache Kylin 有多牛?》:本文来自李栋在《大数据杂谈》公众号的分享。分享的主题是:聊聊“神兽”Apache Kylin 的最新特性。本次分享将首先对 Apache Kylin 进行基本介绍;接下来介绍 1.5.x 最新版本在架构上的重要更新;然后对即将发布的 1.5.2 版本进行功能预告
  5. 《Spark 多数据源计算实践及其在 GrowingIO 的实践》:本文主要介绍如何使用 Apache Spark 中的 DataSource API 以实现多个数据源混合计算的实践。GrowingIO 通过使用 SparkSQL 加 DataSourceAPI 的方法在很短时间内搭建起一套完整的数据处理平台,并且扩展性很好
  6. 《首席工程师揭秘:LinkedIn 大数据后台是如何运作的》:Jay Kreps 是来自 LinkedIn 的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计

深度观点

  1. 《深度重磅 | 麻省理工科技评论:AI 即将腾飞》:人工智能,就像字面的含义一样,它是模拟人类思考元素的集大成者,学习能力和推理能力是其核心内容。举个简单的例子,“机器学习(Machine Learning)”就是人工智能领域里很有前途的课题,其主要内容是利用大数据训练程序,让它们找到一些可遵循的规律,并且让程序本身大胆的预测结果。讲完对人工智能最基本的定义,我们有必要通过下面的图表来回顾人工智能的发展历史,包括其中的大事件
  2. 《深度点评亚马逊、微软、谷歌、IBM 等 6 大机器学习云》:机器学习云这么多,各家特色是什么?哪个适合练级,哪里高手齐聚?哪家有不为人知的 Bug?最重要的,哪个最适合解决你的问题?资深程序员实测点评亚马逊、微软、谷歌、IBM 等6大机器学习云平台,分析各自优缺点。开发者、数据科学家、商业用户或者单纯爱好者都能从本文中受益
  3. 《重磅丰田接手谷歌旗下波士顿动力6大原因》:2016 年 5 月 28 日,根据 Tech Insider 的报道,Google 旗下的波士顿动力机器人公司将被丰田收购,虽然价格还没有公开,但交易近乎完成

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-30 19:002948
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 93577 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

《SQL必知必会》读书笔记

懒时小窝

数据库 sql

深度剖析OpenHarmony应用/服务的逻辑结构

Anna

OpenHarmony

OpenHarmony啃论文计划-elf文件格式介绍

Anna

OpenHarmony

java培训Stream遍历树形结构案例分享

@零度

stream JAVA开发

编码的底层原理

程序员猪小哼

java面试 底层原理 死磕 Java 基础

2hutool源码分析:DateUtil(时间工具类)-常用的时间类型Date,DateTime

爱好编程进阶

Java 程序员 后端开发

浅谈C#可变参数params

yi念之间

C# params

关于「应变力」这个超能力|ONES 人物

万事ONES

管理

我推荐的Flutter项目结构

坚果

4月月更

浅谈C#字符串构建利器StringBuilder

yi念之间

C# StringBuilder

新冠疫情防控背后有哪些鲜为人知的技术?

DS小龙哥

4月月更

OpenHarmony应用开发之全局配置参数解析

Anna

OpenHarmony

Android C++系列:函数知识知多少

轻口味

c++ android 4月月更

web前端培训懒加载对 Web 性能的影响

@零度

前端开发 懒加载

OpenHarmony 设备开发环境搭建 / 源码获取 / 编译 / 烧录

Anna

OpenHarmony

浅谈云上攻防——Etcd风险剖析

腾讯安全云鼎实验室

安全攻防 网络安全

怎么写帮助文档?产品人看过来

小炮

帮助中心

13 高可用的服务

爱好编程进阶

Java 程序员 后端开发

大数据培训Hive架构思想与设计原理

@零度

hive 大数据开发

架构实战营作业四

热猫

【直播回顾】OpenHarmony知识赋能第五期第二课——成为社区达人

OpenHarmony开发者

OpenHarmony 社区贡献

了解HTTP的基本历史及知识

CRMEB

2020年Java面试复盘,收获Offer,金三银四程序员面试精装版pdf,分享给跳槽面试的程序员

爱好编程进阶

Java 程序员 后端开发

API 文档构建工具 - Swagger2简单应用

爱好编程进阶

Java 程序员 后端开发

密码基础设施提供商三未信安加入龙蜥社区

OpenAnolis小助手

合作伙伴 龙蜥社区 CLA 三未信安 密码基础设施

谈谈对 Database Plus 认识与畅想

SphereEx

Apache 数据库 SphereEx ShaardingSphere

为什么boolean存储需要32bit?

程序员猪小哼

java基础 底层原理

API 分页探讨:offset 来分页真的有效率吗?

爱好编程进阶

Java 程序员 后端开发

「质量三人行之不止测试」直播问题解答

BY林子

软件测试 职业发展 质量赋能 测试转型 质量内建

OpenHarmony技术日探讨教育发展,聚焦开源人才培养

OpenHarmony开发者

OpenHarmony

金蝶云·苍穹峰会震撼来袭

金蝶云·苍穹

大数据与机器学习周报 第10期:Twitter Heron正式开源_大数据_丁涛_InfoQ精选文章