十年颠覆,Uber终于成功上市,这被认为是继Facebook、阿里巴巴之后最具价值的科技公司IPO之一,也是今年上市的硅谷“独角兽”中的一员。十年时间,Uber从亏损40亿到营收百亿美元,业务从美国到遍布五大洲,月活从0到9100万人次,支撑其快速成长背后的技术力量值得探寻。在过去10年,InfoQ对Uber的技术实力进行了全方位报道,以下挑选了部分精彩内容,以飨读者。
这是解析 Uber 技术栈两篇文章的上篇,本文讨论 Uber 技术栈较底层的部分。
这是解析 Uber 技术栈两篇文章的下篇,本文讨论 Uber 技术栈与乘客和司机相关的部分。
最近,Uber 软件工程师 Evan Klitzke 写了一篇文章介绍系统的底层存储由 Postgres 换成 MySQL 的原因。HackerNews 上的用户给了许多点评。
Uber 是一款提供出租车预定服务的手机应用,自 2009 年在旧金山推出以来取得了巨大的成功。Uber 立足于大数据,其整个商业模型就是以大数据众包原则为基础。他们有一个巨大的司机数据库,其中包含了他们提供服务的城市中的司机信息。当乘客有搭乘请求时,它可以立即匹配出最合适的司机。Bernard Marr 是一名全球公认的大数据专家。近日,他撰文介绍了大数据在 Uber 的两个重要应用峰时定价和评价系统。
Uber 的工程团队撰写一篇文章,介绍了他们的大数据平台如何从传统的基于关系型数据库的 ETL 作业演变为基于 Hadoop 和 Spark 的平台。可扩展的摄取模型、标准传输格式和用于增量更新的自定义库是这个平台的关键组件。
日前,网约车服务商 Uber 开源并发布了它们开发的 Ludwig,这是一款基于 Google TensorFlow 框架上的开源工具箱。藉由 Ludwig,用户无需再编写任何代码即可进行深度学习的开发,AI 前线为读者们翻译了由 Uber AI 工程师们撰写的这篇文章,希望有所启示。
Uber 的 Web 平台团队开发了 Fusion.js,一个开源的 Web 框架,用于简化 Web 开发,并构建出高性能的轻量级 Web 应用程序。
Marmaray 由我们的 Hadoop 平台团队设计和开发,是一个建立在 Hadoop 生态系统之上的基于插件的框架。用户可以新增插件以便从任何来源摄取数据,并利用 Apache Spark 将数据分散到接收器上。Marmaray 这个名字源于土耳其的一条连接欧洲和亚洲的隧道,在 Uber 内部,我们将 Marmaray 设想为根据客户偏好将数据从任何来源连接到任何接收器的管道。
优步发布了 Kraken,这是一个开源的点对点(P2P)Docker 容器仓库。Kraken 旨在为大规模系统提供 Docker 镜像服务,解决跨区域支持、性能瓶颈和混合云环境所面临的挑战。
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题。