QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

优步发布开源服务 Kraken:一款 P2P Docker 容器仓库

作者:K Jonas

  • 2019-04-09
  • 本文字数:1284 字

    阅读完需:约 4 分钟

优步发布开源服务Kraken:一款P2P Docker容器仓库

优步于 3 月 5 日发布了 Kraken,这是一个开源的点对点(P2P)Docker 容器仓库。Kraken 旨在为大规模系统提供 Docker 镜像服务,解决跨区域支持、性能瓶颈和混合云环境所面临的挑战。


Kraken 大致基于BitTorrent协议,与 Docker registry API 兼容,并提供可配置的存储后端,诸如S3HDFS等。Kraken 最初于 2018 年初在优步内部开始部署,随后向开源社区公开。


在容器中运行的Docker镜像是由镜像层组成的,这些层包含了相对之前的层所发生的变更,并与镜像文件和可执行文件的二进制大对象(blob)相关联。Docker容器仓库是服务端应用,用于存储和分发镜像层和镜像 blob。Docker 在Docker Hub 提供了免费的容器仓库,另外还提供了商业版本的容器仓库。除 Docker 外,还诞生了很多其它容器仓库以满足各种特殊需求,例如私有托管或将 IPFS 实现为存储后端


优步在一个混合云环境中运行自己的大规模分布式集群。 尽管优步努力通过镜像缓存和数据库分片来提高性能,但 Docker 仓库还是无法满足其环境下不断增长的需求,最终优步团队选择构建了自己的解决方案


Kraken 在优步部署以来,每天能支持超过 100 万个 blob。 在优步的生产高峰时期,Kraken 可以在 30 秒内分发多达 2 万个 blob,每个 blob 的大小从 100MB 到 1GB 不等。 根据Kraken文档介绍,Kraken 能够在每个主机上以高于下载速度上限达 50%的速度分发 Docker 镜像。此外,集群大小和镜像大小都对下载速度没有显著影响。Kraken未来的改进将集中在提升大镜像性能、安全性改进和支持 Docker 标记转换等方面。


Kraken 的优秀架构是优步得以实现可扩展且高度可用的容器仓库的关键所在。该设计的基础是一个定制的 P2P 网络,其中包含数量有限的主机,这些主机将内容分发(seed)到代理网络上。网络中的代理形成具有高连通性和小直径的伪随机规则图,这是提升系统下载速度的重要环节。代理接受来自源的内容,源则在后端存储镜像 blob,并与网络中的端点连接,返回 docker 所请求的镜像。



优步 Kraken 架构(图片来自 Kraken README)


Kraken 最初是使用 BitTorrent 构建的,但 Kraken 与 BT 网络面临的挑战差异导致 Kraken 团队开始构建自己的 P2P 驱动。但该团队也在积极审查 Kraken 协议,以便使其再次与 BitTorrent 实现兼容。


阿里巴巴的原生云计算基金会(CNCF)下属的Dragonfly项目也是一个开源的 P2P 镜像和文件分发系统,可以解决原生云应用中面临的分发问题。Kraken 的文档中注明了两者之间的主要差异:


Dragonfly 集群有一个或几个“超级节点”,用于协调集群中每个 4MB 大小的数据块的传输。虽然超级节点能够做出最佳决策,但整个集群的吞吐量会受到一台或数台主机的处理能力限制,并且随着 blob 大小或集群大小的增加,整体性能会线性下降。

Kraken 的追踪器仅帮助协调连接图,并将实际数据传输的协商留给单独的端点处理,因此 Kraken 可以更好地扩展到大型 blob。最重要的是,Kraken 是 HA 并支持跨集群复制,这两点都是可靠的混合云设置所必需的。


有关 Kraken 的更多信息可以访问GitHub页面,也可以加入优步的Slack频道


查看英文原文Uber Releases Kraken: An Open Source P2P Docker Registry


2019-04-09 08:005031

评论

发布
暂无评论
发现更多内容

如何通过对敏捷实践的调整,帮助远程团队提升研发效能?

思码逸研发效能

DevOps 研发效能 远程办公 研发效能度量 研发效能管理

Oracle Linux 9.5 正式版发布 - Oracle 提供支持 RHEL 兼容发行版

sysin

Linux RHEL orcle

如何进行需求管理

易成研发中心

需求管理

产品经理如何高效的进行需求管理

易成研发中心

需求管理 需求管理工具

IC China 2024北京开幕:英特尔分享洞察,促智能计算应用落地

E科讯

智源行业应用大模型挑战赛开启报名:挖掘数据潜能,共创行业新篇

智源研究院

【论文速读】| 迈向自动化渗透测试:引入大语言模型基准、分析与改进

云起无垠

怎么制作职业生涯规划ppt?用这2个AI工具自动生成ppt!

职场工具箱

人工智能 职场 PPT AIGC AI生成PPT

15.模版模式设计思想

杨充

SimbaSchema在数据云平台中的可观测性实践与应用

奇点云

可观测性

【GreatSQL优化器-03】查询开销估算

GreatSQL

数据库 greatsql

9.9比9.11大0.79,让大模型准确地做好数学题

Kyligence

大模型 #人工智能 数学计算

全网最全商品模型设计方案,不接受反驳!

不在线第一只蜗牛

Java 人工智能 大数据

5款主流AI模型,千万Token免费用,体验极速智能!

轶天下事

全球IP地址库性能评测:数据覆盖与精确性研究

幂简集成

IP API

GroovyShell 应用实践

FunTester

RAG系统高效检索优化指南:精准搭配BGE智源、GTE阿里与Jina等嵌入与精排模型

代码忍者

国产化身份目录 芯盾时代数字身份产品矩阵

芯盾时代

数字身份 信息技术 iam 国产化替代

抖音商品详情API接口对电商的作用及收益

科普小能手

API API 接口 抖音商品详情API接口 抖音API 抖音API接口

技术干货丨基于Radioss及HyperLife的车门SLAM疲劳分析

Altair RapidMiner

汽车 仿真 智能制造 altair Hypermesh

Helius:从数据出发,衡量 Solana 的真实去中心化程度

TechubNews

《Django 5 By Example》阅读笔记:p651-p678

codists

Python django

Rocky Linux 9.5 正式版发布 - RHEL 100% 1:1 兼容免费发行版

sysin

Rocky Linux RHEL

DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

阿里云大数据AI技术

最佳实践 PAI DistilQwen2 大模型蒸馏

优步发布开源服务Kraken:一款P2P Docker容器仓库_开源_InfoQ精选文章