立即领取|华润集团、宁德核电、东风岚图等 20+ 标杆企业数字化人才培养实践案例 了解详情
写点什么

大数据与机器学习周报 第 10 期:Twitter Heron 正式开源

  • 2016-05-30
  • 本文字数:1758 字

    阅读完需:约 6 分钟

编者按:本系列周报从第 10 期开始做出重大改版。今后将分为“业界新闻”、“技术干货”和“深度观点”3 大版块。感谢大家一直以来的关注和支持,我们将继续努力为读者奉献高质量的内容。

业界新闻

  1. 《重磅 | Twitter Heron 正式开源》:去年,Twitter 对外宣布了新的分布式流计算系统 Heron,随后消息称 Twitter 已经用 Heron 替换了 Storm。据文中介绍,Heron 支撑 Twitter 的所有实时分析业务已经有两年多了。它替代了之前使用的 Apache Storm 系统。Heron 有很多架构方面的改进,而且向后兼容 Storm 生态系统
  2. 《Spark 2.0 技术预览版正式发布下载》:在过去 Spark 社区创建了 Spark 2.0 的技术预览版,经过几天的投票,目前该技术预览版今天正式公布
  3. 《真正的人工智能?Siri 被曝将迎来革命性更新》:2015 年,苹果(已知)收购了三家与人工智能技术相关的企业,它们分别是 Emotient、Perceptio 和 VocallQ。其中,VocallQ 是一家来自英国的语音识别学习软件公司。除了 Beats 和 Siri 之外,苹果在过去几年所收购的企业似乎都没有什么名气可言。不过在今年的 WWDC 大会上,VocallQ 可能就要大放异彩了

技术干货

  1. 《童有军:怎样进行精准用户画像》:童有君现任 FreeWheel 主任工程师,以下就广告平台中用户画像和标注噪声处理进行先行采访。童表示用户画像在广告平台的应用中与传统电商在定位与需求方面着眼不同。期间谈到 LR 模型拥有两大优点,并表示看好深度学习领域的前景
  2. 《Uber 怎样使用 Spark 和 Hadoop 优化用户体验》:如果你用过 Uber,你一定会注意到它的操作是如此的简单。你一键叫车,随后车就来找你了,最后自动完成支付,整个过程行云流水。但是,在这简单的流程背后其实是用 Hadoop 和 Spark 这样复杂的基础大数据架构来支撑的
  3. 《Spark 性能优化指南——高级篇》:继基础篇讲解了每个 Spark 开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark 性能优化指南》的高级篇,将深入分析数据倾斜调优与 shuffle 调优,以解决更加棘手的性能问题
  4. 《大数据分析界的“神兽”Apache Kylin 有多牛?》:本文来自李栋在《大数据杂谈》公众号的分享。分享的主题是:聊聊“神兽”Apache Kylin 的最新特性。本次分享将首先对 Apache Kylin 进行基本介绍;接下来介绍 1.5.x 最新版本在架构上的重要更新;然后对即将发布的 1.5.2 版本进行功能预告
  5. 《Spark 多数据源计算实践及其在 GrowingIO 的实践》:本文主要介绍如何使用 Apache Spark 中的 DataSource API 以实现多个数据源混合计算的实践。GrowingIO 通过使用 SparkSQL 加 DataSourceAPI 的方法在很短时间内搭建起一套完整的数据处理平台,并且扩展性很好
  6. 《首席工程师揭秘:LinkedIn 大数据后台是如何运作的》:Jay Kreps 是来自 LinkedIn 的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计

深度观点

  1. 《深度重磅 | 麻省理工科技评论:AI 即将腾飞》:人工智能,就像字面的含义一样,它是模拟人类思考元素的集大成者,学习能力和推理能力是其核心内容。举个简单的例子,“机器学习(Machine Learning)”就是人工智能领域里很有前途的课题,其主要内容是利用大数据训练程序,让它们找到一些可遵循的规律,并且让程序本身大胆的预测结果。讲完对人工智能最基本的定义,我们有必要通过下面的图表来回顾人工智能的发展历史,包括其中的大事件
  2. 《深度点评亚马逊、微软、谷歌、IBM 等 6 大机器学习云》:机器学习云这么多,各家特色是什么?哪个适合练级,哪里高手齐聚?哪家有不为人知的 Bug?最重要的,哪个最适合解决你的问题?资深程序员实测点评亚马逊、微软、谷歌、IBM 等6大机器学习云平台,分析各自优缺点。开发者、数据科学家、商业用户或者单纯爱好者都能从本文中受益
  3. 《重磅丰田接手谷歌旗下波士顿动力6大原因》:2016 年 5 月 28 日,根据 Tech Insider 的报道,Google 旗下的波士顿动力机器人公司将被丰田收购,虽然价格还没有公开,但交易近乎完成

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-30 19:002952
用户头像
丁涛 越努力,越幸运

发布了 35 篇内容, 共 93702 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

架构师训练营第三周作业2

韩儿

第三周架构师训练营作业

lithium

架构师训练营第三周学习笔记

邢永春

极客大学 - 架构师训练营 第七周

9527

架构师训练营第 3 周学习总结

菜青虫

极客大学架构师训练营

架构师训练营第 3 周课后练习

菜青虫

极客大学架构师训练营

架構師訓練營 week7 作業

ilake

极客时间架构师训练营 1 期 - 第 7周总结

Kaven

架构师训练营第七周

我是谁

极客大学架构师训练营

使用K3S创建本地开发集群

东风微鸣

Kubernetes k3s Traefik

架构师训练营第 1 期 - 第 7 周课后练习

Anyou Liu

极客大学架构师训练营

架构训练营第三周作业

李日盛

架构设计

架构师训练营第三周作业

邢永春

中国Java教父把十几年经验总结成:程序员自学的七条路(完整版)

Java架构师迁哥

代码重构-设计模式总结

Mars

设计模式示例

Mars

单例模式 组合模式

架构师训练营第七周课后作业

Gosling

极客大学架构师训练营

Week3 - 练习

evildracula

架构

架构师入门学习感悟三

笑春风

第三周作业

tothegump

极客大学架构师训练营

极客时间架构师培训 1 期 - 第 7 周作业

Kaven

第三周 单例

Geek_9527

如何将PyTorch Lightning模型部署到生产中

计算机与AI

学习 PyTorch

学习笔记:架构师训练营-第七周

四夕晖

第七周作业

alpha

极客大学架构师训练营

性能优化-性能测试,系统优化,锁

garlic

极客大学架构师训练营

CAP原理及作业

橘子皮嚼着不脆

性能压测时,并发压力增加,系统响应时间和吞吐量如何变化

escray

极客大学 极客大学架构师训练营 课程作业

架构师训练营第三周作业1

韩儿

架構師訓練營 week7 總結

ilake

架构师训练营 -week07-总结

大刘

极客大学架构师训练营

大数据与机器学习周报 第10期:Twitter Heron正式开源_大数据_丁涛_InfoQ精选文章