写点什么

怎样在 1 秒内启动 Linux

  • 2015-12-02
  • 本文字数:1925 字

    阅读完需:约 6 分钟

尽可能快的启动系统,对于自动化设备是非常重要的。系统能够在用户无法感知的时间内启动,也就意味着在不需要工作时,可以完全切断电源,而不是挂起进入休眠状态。本文基于 Atmel AT91 系列片上系统和 NAND 闪存,经过一系列的优化,将 Linux 系统启动时间,从最初的 11 秒,降低到最终的 656 毫秒。

背景知识

系统从上电到完全启动,需要经过许多过程。一个简化的启动流程大概包含:

  1. 硬件重置
  2. 启动引导程序(bootloader)
  3. 操作系统初始化
  4. 应用程序执行

其中硬件非常关键,但是硬件一般难以更改。后续的优化,主要针对引导程序、Linux 内核和应用程序展开。

引导程序优化

引导程序主要完成对 CPU 的基础设置,处理 ARM 标记(ATAGS,ARM TAGS)或设备树(device trees),切换存储管理单元(MMU,Memory Management Unit)等工作。

重要通知:接下来 InfoQ 将会选择性地将部分优秀内容首发在微信公众号中,欢迎关注 InfoQ 微信公众号第一时间阅读精品内容。

对于 U-Boot,常用的优化方式有:

  • 删除不不要的功能:如网络加载等,如果不需要,那么直接移除这些代码吧;
  • 关闭不需要的功能
    • 关闭内核镜像验证
    • 关闭引导程序输出
    • 关闭启动延迟
  • 将通用功能的引导程序修改成一个优化后的初始程序加载器(Initial Program Loader,IPL),对于 U-Boot,可以通过 SPL(Second Program Loader,第二阶段程序加载器)来实现。

内核优化

Linux 内核被设计的非常灵活,可以针对需要的功能做各种配置优化。因此,优化内核对于系统启动速度是至关重要的。

首先,移除一切不要的驱动,尽可能的减少内核加载的内容,能够大大缩短系统启动时间。其次,还有很多内核选择可能需要进一步尝试,比如内核压缩方式,对于嵌入式系统来说,LZO 压缩方式,通常会是一个不错的选择。最后,还可以通过定制一些启动参数,达到加快启动的目的。例如可以通过“lpj=”参数,预设每个循环需要的节拍数(loops per jiffy,lpj)的值,避免系统在启动时自动推算。这样在基于 ARMv5 的系统中,可以节省 100ms 以上的时间。

对于内核启动的优化,可以通过 bootgraph.pl 脚本(位于内核源码的 script/bootgraph.pl )来绘制内核启动耗时图表,用以分析启动最耗时的地方。这个脚本使用非常简单,直接将 dmesg 的输出作为其输入,即可生成 svg 图表:

dmesg | perl scripts/bootgraph.pl > output.svg生成的图表如下图,

图中每一个色段表示一个功能的初始化耗时。可以简单的关闭不需要的功能,或者针对功能进行特定的优化。

除了内核本身之外,内核所在的文件系统也对系统启动有着非常大的影响。对于使用闪存芯片作为存储的系统来说, UbiFS 是一个很好的选择。它能够容忍意外断电,有着出色的挂载速度,以确保系统快速启动。

应用程序优化

内核完成系统启动之后,接来下就是执行应用程序。对于应用程序的优化,主要有两部分,一部分是由应用程序来接管启动的 INIT 进程,另一部分是优化应用程序的链接方式。

标准的 SystemV INIT 程序,需要执行一堆启动脚本。对于嵌入式系统来说,大部分是没有意义的。另一部分(比如挂载文件系统),可以由应用程序自己来实现。然后,可以在内核启动参数中通过“init=”参数,将 INIT 进程直接指定为应用程序。

应用依赖的动态链接库,会按照以下顺序查找:

  1. LD_PRELOAD 环境变量指定的路径(一般对应文件 /etc/ld.so.preload);
  2. ELF .dynamic 节中 DT_RPATH 入口指定的路径,若 DT_RUNPATH 入口不存在的话;
  3. 环境变量 LD_LIBRARY_PATH 指定的路径,但如果可执行文件有 setuid/setgid 权限,则忽略这个路径;编译时指定–library-path 会覆盖这个路径;
  4. ELF .dynamic 节中 DT_RUNPATH 入口指定的路径;
  5. ldconfig 缓存中的路径(一般对应 /etc/ld.so.cache 文件),若编译时使用了 -z nodeflib 的链接选项,则此步跳过;
  6. /lib,然后 /usr/lib 路径 ,若使用了 -z nodeflib 链接选项,则此步亦跳过;

因此,尽可能的将应用程序依赖的动态链接库放到优先查找的路径,可以加快链接速度。对于交叉编译环境特别需要注意,主机上的动态链接库位置和目标系统上的位置可能不一致,这会增加应用程序执行时动态链接库的加载时间。

总结

基于上面提到的三个优化点,可以将系统的启动时间,从最初的 11s 降低到 656ms(数据参考 Jan Altenberg 在都柏林举行的嵌入式 Linux 会议上的演讲稿)。从硬件到引导程序再到内核最后到应用程序,每个启动步骤都有自己可优化的地方,经过一些简单的优化,就可以减少系统的启动时间。


感谢魏星对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-02 18:004598

评论

发布
暂无评论
发现更多内容

人社大赛算法赛题解题思路分享+第五名

阿里云天池

#大数据

赛题解析 | 初赛赛道三:服务网格控制面分治体系构建

阿里云天池

云原生

淘宝商品详情数据的高效获取与多元应用

Noah

极石汽车:找准细分市场定位,加速完成品牌进阶

Geek_2d6073

什么是算力?

九章云极DataCanvas

袋鼠云产品功能更新报告11期|能力AI+,实力拿捏!

袋鼠云数栈

如何实现持续、主动、长效的数据治理?主动元数据或是最佳答案

Aloudata

数据治理 元数据 全链路数据血缘 数据血缘 数据链路

心辰 Lingo 语音 AI 模型开放内测预约;Meta Sapiens 模型让 AI 分析图像中人类动作丨 RTE 开发者日报

声网

聚道云软件连接器8月新增应用合集(3)

聚道云软件连接器

功能更新

AutoGPT理念与应用

霍格沃兹测试开发学社

《2024快应用智慧服务生态白皮书》发布,探索AI与快应用融合之路

科技热闻

低代码革命:JNPF平台如何简化企业应用开发

EquatorCoco

低代码

淘宝拍立淘接口全攻略:轻松实现图片搜索商品

tbapi

淘宝API 淘宝图片搜索接口 淘宝拍立淘接口

【首席战略官分享】工作数字化的中国历程 | 从 OA 到 BPM 到数字流程自动化

望繁信科技

数字化转型 流程挖掘 流程智能

Web3 游戏周报(8.18 - 8.24)

Footprint Analytics

链游

强强联手!媒体行业正式启用“算力包”模式算力服务!

九章云极DataCanvas

智能弹性实践:Kubernetes HPA 与观测云的自定义指标集成

观测云

k8s

第三期安全AI挑战者计划-文本分类对抗攻击 第十名「你钉起来真好听」技术总结

阿里云天池

2021全国数字生态创新大赛-智能算法赛季军方案 乘风破浪的炼丹师队

阿里云天池

共筑运维稳定磐石!华为云“数智先锋100·企业运维稳定性治理研讨会”南京站成功举办

科技热闻

优化系统性能:深入探讨Web层缓存与Redis应用的挑战与对策

不在线第一只蜗牛

redis 缓存 Web

你敢在大学本科期间创办一家属于自己的公司吗?WTEAM 2024 年度大会,广州,9.10丨伙伴活动推荐

声网

ICEAI持续稳步发展,拓展全球市场交易版图

科技热闻

Manulife IM发布自然资本、TCFD和SRI报告

财见

QCN9074, QCN9274, QCN9224 chip all-round analysis - leading the future of wireless networks

wifi6-yiyi

WiFi7

释放生产力:JNPF低代码开发平台的五大优势

不在线第一只蜗牛

低代码 数字化

机器学习算法常用指标总结

阿里云天池

商品详情API返回值中的商品重量与体积信息

技术冰糖葫芦

API Explorer API 测试 API 策略 pinduoduo API

奥运项目背后的智能制造世界:如何助力赛场的每一次超越?

Altair RapidMiner

人工智能 机器学习 数据分析 仿真 altair

关于 Git 的6大提示和技巧

秃头小帅oi

使用poetry来更优雅的管理 python 包

我再BUG界嘎嘎乱杀

Python 编程 后端 开发语言 Poetry

怎样在1秒内启动Linux_Linux_金灵杰_InfoQ精选文章