写点什么

Helios 使用卫星内核处理异构环境

  • 2009-10-25
  • 本文字数:1741 字

    阅读完需:约 6 分钟

Helios 是微软的一个研究性的操作系统项目,它试图通过使用卫星内核来简化为异构的环境编写应用程序的过程。该项目的研究者包括:Edmund B.Nightingale、Orion Hodson、Ross McIlroy、Chris Hawblitzel 和 Galen Hunt,他们还发表了论文《 Helois:带有卫星内核的异构多处理》(PDF)。

这个研究项目开始于这样的一种言论,当系统包含相互交换数据的 CPU 时,这些 CPU 执行相同的一组指令,并提供相同的功能,它们会包含带有强大计算能力的可编程设备,像 NIC GPU ,但它们分别拥有自己的指令集和控制器。此外,操作系统对这样的可编程设备和任何其它不可编程的 IO 设备进行同样的处理,CPU 和 IO 卡之间的通信被限制为通过设备驱动在二者之间传递数据流,而不是提供软件接口,那样应用程序可以用其在这样的卡上执行特定的任务。作者提到的另一个问题是,设备驱动在操作系统中是运行在特权模式中的,但是它们变得越来越复杂。在文章中提到的一个例子是 NVidia 显示驱动,其中包含有 JIT 编译器。

作者的解决方案是 Helios,这个操作系统中包含的不是单一的内核,而是多个卫星内核。这样的内核运行在任何 CPU 或者设备上,具有可计算的能力,输出一个通用的接口和一组能够被所有内核和假定在这样的系统上运行的应用程序所理解的操作系统抽象集。卫星内核是:

微内核。每个卫星内核都是由调度器、内存管理器、命名空间管理器以及协调与其他内核通信的代码所组成的。所有其它传统的操作系统驱动和服务(例如:文件系统)都作为单独的线程执行。第一个用来启动的卫星内核叫做协调内核,它会找到可编程设备,并载入其它卫星内核。

内核通过远程消息传递来与其他内核通信:

Helios 为那些在卫星内核上执行的服务提供了透明的访问,这是通过扩展一种传统的消息传递接口以包含远程消息传递完成的。当位于相同卫星内核上的应用程序或者服务彼此之间进行通信的时候,就会使用一种快速的、零复制的消息传递接口。然而,如果通信发生在两个不同的卫星内核之间,那么远程消息传递会自动配置内核之间的消息,以使通信变得方便。由于应用程序是为消息传递接口而编写的,因此当应用程序运行在可编程的设备上时,不需要任何改变。

Helios 引出了一种亲和度(affinity)度量,它表示的是在内核中运行进程的合适程度。这个度量被用于决定进程应该被安排运行在哪个内核上,如果这个特定的内核在执行那段代码时会表现得更好,内核被绑定到其下的硬件上。好的亲和度说明应在该内核上运行进程,而不好的则说明需要寻找另外的内核。

例如,Helios 网络堆栈说明了对于用来与网络设备驱动通信的通道拥有较好的亲和度。当拥有可编程的网络适配器的时候,网络堆栈和执行在适配器上的驱动之间的好的亲和度,使得 Helios 能够自动将所有网络堆栈卸载到适配器上。卸载网络堆栈并不需要对其源代码做任何的改变。

为了让这个方法起作用,Helios 使用了两步的编译过程。应用程序首先从源代码被编译为中间语言,然后,到了安装的时候,应用程序基于系统的架构,或者更准确的说是找到的处理器(CPU、GPU、NIC 等)的指令集,被编译为机器码。

该团队已经为 XScale 可编程 IO 卡(使用 ARM 架构)和具有缓冲一致性(cache-coherent )的 NUMA 架构编写了内核。他们都申明获得了性能上的改善。

通过将任务卸载到 XScale I/O 卡上,我们的性能得到了 28% 的提升。在邮件服务器的测试评分中,通过自动在多个 NUMA 域中切分应用程序,我们的性能得到了 39% 的提升。

Helios 基于微软的一个研究项目—— Singularity ,该项目试图探索一种新的操作系统的选择。Helios 未来的计划包括:为像 Inter Larabee 显卡这样的 GPU 创建内核;寻找通过在内核之间移动 CPU 和内存来允许进程跨越多个 NUMA 域的方法;以及如何利用 Windows 的设备驱动的扩展驱动集以及它的内核代码来创建卫星内核。

查看英文原文: Helios Uses Satellite Kernels to Deal with Heterogeneous Environments - - - - - -

译者介绍:侯伯薇,生于丹东凤城,学在春城长春,工作在滨城大连;虽已年过而立,但自问童心未泯;对代码热情不减,愿与天下程序员共同修炼,不断提升。译有《学习WCF》、《Expert C# 2008 Business Objets》。InfoQ 中文站内容团队,尤其是架构、SOA 和Ruby 社区需要您的参与,有意者请邮件至 editors【AT】cn.infoq.com

2009-10-25 21:202656
用户头像

发布了 340 篇内容, 共 146.2 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

智慧城市、数字政府、城市大脑、一网统管之间有什么关系

雨果

智慧城市 城市大脑 数字政府 一网统管

Pytorch、CUDA和cuDNN的安装图文详解win11(解决版本匹配问题)

timerring

PyTorch cuda 10月月更 cudnn

MetaForce佛萨奇魔豹2.0系统开发技术讲解方案

I8O28578624

基于 MinIO 部署单实例 Databend | 新手篇(1)

Databend

场景金融持续引发行业关注,4.0时代打造金融服务新生态

易观分析

银行 场景金融

开启自然资源管理“智绘”之路!

天翼云开发者社区

天翼云推出全栈政务混合云支持私有化运行

天翼云开发者社区

前端二面手写面试题总结

helloworld1024fd

JavaScript

哪里有便宜的云服务器?可以下月付款吗?

行云管家

云计算 服务器 云服务器

项目实战:在线报价采购系统(React +SpreadJS+Echarts)

葡萄城技术团队

React 项目实战 采购软件 echart

千锋1024程序员节大咖讲师技术直播火力全开

千锋IT教育

浅谈Mixin、Composition API、Reactive API、Ref API以及readonly🔥

渔戈

前端 Vue3 10月月更

JscriptScript的类型

渔戈

JavaScript 前端 10月月更

永久免费低代码开发平台有哪些?

优秀

低代码 低代码开发平台

现代农业|AIRIOT智慧农业管理解决方案

AIRIOT

低代码 物联网 智慧农业

手写JavaScript常见5种设计模式

helloworld1024fd

JavaScript

华为云弹性公网IP服务,为企业敲开互联网大门

清欢科技

全局图优化:提升 MegEngine 模型推理性能的又一神器

MegEngineBot

深度学习 开源 性能优化 MegEngine 全局图优化

凭什么 31x31 大小卷积核的耗时可以和 9x9 卷积差不多?| 文末附 meetup 回顾

MegEngineBot

深度学习 开源 卷积 MegEngine

快被Gartner捧上天的Data Fabric数据经纬到底是个啥?

雨果

Data Fabric 数据经纬

嵌入式 Linux 入门(六、Shell 脚本编程下:Shell 脚本语法)

矜辰所致

Linux Shell shell脚本编程 10月月更

华为云全球加速GA,助力中小企业突破发展瓶颈!

清欢科技

高可用系统哪家靠谱?工作原理是什么?

行云管家

高可用 高可用架构 高可用集群

基于Delta Lake构建数据湖仓体系

阿里云大数据AI技术

大数据 开源 企业号十月 PK 榜

手写现代前端框架diff算法-前端面试进阶

helloworld1024fd

JavaScript

华为云全球加速GA,让企业获得更优质的服务体验

清欢科技

华为云全球加速GA,助跨境企业云上业务通达

清欢科技

SAP | 消息 MESSAGE

暮春零贰

SAP 消息 10月月更

2022年中国篮球内容消费趋势洞察

易观分析

消费 篮球

落地DataOps,必须克服的挑战有哪些?

雨果

DataOps

Helios使用卫星内核处理异构环境_微软_Abel Avram_InfoQ精选文章