大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

如何使用本地 Docker 更好地开发?我们总结了这八条经验

  • 2022-05-19
  • 本文字数:2705 字

    阅读完需:约 9 分钟

如何使用本地Docker更好地开发?我们总结了这八条经验

如果你像我们一样需要运行许多不同的应用程序,那么将开发环境容器化可以极大地提高工作效率。这里有一些可以优化本地 Docker 环境的技巧。

 

在 Viget,Docker 已经成为本地开发不可或缺的工具。我们的团队构建和维护着大量的应用程序,运行着不同的软件栈和版本,并且能够将开发环境打包,这让不同项目的切换和开发人员快速上手新项目变得非常容易。这并不是说在本地使用 Docker 开发就没有缺点,但它带来的便利远远超过了缺点。

 

随着时间的推移,我们总结出了自己的一套最佳实践,可以有效设置 Docker 开发环境。请注意最后一点(“本地开发”)——如果你是为了部署而创建镜像,那么这些原则中的大多数都不适用。我们的开发环境一般包括(通过 Docker Compose 编配):

 

  • 应用程序(例如 Rails、Django 或 Phoenix);

  • JavaScript 监视器/编译器(例如 webpack-dev-server);

  • 数据库(通常是 PostgreSQL);

  • 其他必要的基础设施(如 Redis、ElasticSearch、Mailhog);

  • 有些应用程序实例偶尔也会做一些其他的事情,而不只是运行开发服务器(比如后台任务)。

 

基于这样的架构,以下是我们试图进行标准化的最佳实践。

 

不要将代码或应用级的依赖项放入镜像中

 

你的主 Dockerfile 文件,也就是运行应用程序所需的文件,应该包含运行应用程序所需的所有软件,但不应该包含应用程序代码本身——当 docker-compose run 命令开始执行时,它们将被挂载到容器中,并在容器和本地机器之间进行同步。

 

另外,区分系统级依赖项(如 ImageMagick)和应用级依赖项(如 Rubygems 和 NPM 包)也很重要——前者应该包含在 Dockerfile 中,后者不应该。将应用级依赖项放到镜像中意味着每次有人添加新依赖项时都必须重新构建镜像,这既耗时又容易出错。相反,我们应该将这些依赖项作为启动脚本的一部分。

 

非必要不使用 Dockerfile

 

基于第一点,你可能会发现根本不需要编写 Dockerfile 文件。如果你的应用程序没有任何特殊的依赖项,可以将 docker-compose.yml 的入口指向官方的 Docker 仓库(如 ruby:2.7.6)。这样做并不常见——大多数应用程序和框架都需要一定数量的镜像基础(例如,Rails 需要 Node),但如果你发现自己的 Dockerfile 只包含一个 FROM 行,你就可以不使用这个文件。

 

只在 docker-compose.yml 中引用一次 Dockerfile

 

如果你将同一个镜像用于多个服务(你应该这么做),只需要在一个服务的定义中提供构建说明,给它起一个名字,然后在其他服务中引用这个名字。举个例子,假设有个 Rails 应用程序使用一个共享的镜像来运行开发服务器和 webpack-dev-server,那么配置可能像这样:

 

services:  rails:    image: appname_rails    build:      context: .      dockerfile: ./.docker-config/rails/Dockerfile    command: ./bin/rails server -p 3000 -b '0.0.0.0'

node: image: appname_rails command: ./bin/webpack-dev-server
复制代码

 

这样,当我们在构建服务(使用 docker-compose)时,镜像就只构建一次。如果我们省略 image:指令同时复制 build:,就会构建完全相同的镜像两次,这样会浪费磁盘空间和有限的时间。

 

在命名卷中缓存依赖项

 

正如第一点所提到的,我们不会将代码依赖项放到镜像中,而是在启动时安装它们。可以想象的是,如果我们每次重启服务时都从头开始安装 gem/pip/yarn 这样的库,速度会非常慢,所以我们使用 Docker 的命名卷来保持缓存。上面的配置可能会变成这样:

 

volumes:  gems:  yarn:  services:  rails:    image: appname_rails    build:      context: .      dockerfile: ./.docker-config/rails/Dockerfile    command: ./bin/rails server -p 3000 -b '0.0.0.0'    volumes:      - .:/app      - gems:/usr/local/bundle      - yarn:/app/node_modules

node: image: appname_rails command: ./bin/webpack-dev-server volumes: - .:/app - yarn:/app/node_modules
复制代码

 

命名卷的挂载点可能因不同的软件栈而异,但原则是差不多的:将编译后的依赖项保存在已命名的卷中,以大幅缩短启动时间。

 

将临时的东西放入命名卷中

 

上一点提到使用命名卷来提高性能,这里有另一个有用的技巧:将保存只读文件的目录放入命名卷中,阻止它们被同步回本地机器(这会带来很大的性能开销),特别是 log 和 tmp 目录,以及应用程序存储上传文件的地方。

 

根据经验,如果一个目录出现在.gitignore 中,那么最好把它放入命名卷中。

 

在 apt-get 更新后进行清理

 

如果在 Dockerfiles 中引用了基于 Debian 的镜像,你就必须运行 apt-get update,然后才能通过 apt-get install 安装依赖项。如果不做一些处理,一堆额外的数据会被放到镜像中,极大增加了镜像的体积。

 

我们的最佳实践是在一个 RUN 命令中执行更新、安装和清理操作:

 

RUN apt-get update && \  apt-get install -y libgirepository1.0-dev libpoppler-glib-dev && \  rm -rf /var/lib/apt/lists/*
复制代码

 

使用 exec 而不是 run

 

如果需要在容器中运行命令,你有两个选项:run 和 exec。前者将启动一个新容器来运行命令,而后者将连接到一个已经在运行中的容器。

 

在大多数情况下,假设在开发应用程序时总是有其他服务在运行,那么 exec(特别是 docker-compose exec)就是你所需要的,因为它运行起来更快,而且不会留下任何奇怪的文件(如果你忘了在 run 中包含--rm 标志,就会发生这种情况)。

 

使用 wait-for-it 协调服务

 

如果使用了之前提到的共享镜像和依赖项命名卷,你可能会遇到这样的问题:一个服务会在另一个服务的入口点脚本执行完毕之前启动,从而导致发生了错误。当出现这种情况时,我们可以引入wait-for-it脚本,它将向一个 Web 地址发起请求,当这个地址返回响应时再执行命令。

 

所以,我们把 docker-compose.yml 修改一下:

 

volumes:  gems:  yarn:  services:  rails:    image: appname_rails    build:      context: .      dockerfile: ./.docker-config/rails/Dockerfile    command: ./bin/rails server -p 3000 -b '0.0.0.0'    volumes:      - .:/app      - gems:/usr/local/bundle      - yarn:/app/node_modules

node: image: appname_rails command: [ "./.docker-config/wait-for-it.sh", "rails:3000", "--timeout=0", "--", "./bin/webpack-dev-server" ] volumes: - .:/app - yarn:/app/node_modules
复制代码

 

这样,在 Rails 开发服务器完全启动并运行之前,webpack-dev-server 是不会启动的。

 

以上就是我们在过去几年中总结的一些 Docker 最佳实践,我们也将努力保持更新这个清单。

 

原文链接:

 

https://www.viget.com/articles/local-docker-best-practices/

 

2022-05-19 21:036772

评论

发布
暂无评论
发现更多内容

Python网页解析库:用requests-html爬取网页

和牛

测试

网易游戏 Flink SQL 平台化实践

Apache Flink

大数据 flink 编程 流计算 实时计算

STEPN链游系统开发模式详解(运动赚钱模式)

开发微hkkf5566

Paper Time 回顾|MB2:为自治数据库建立行为模型

OceanBase 数据库

物联网技术在物联网产业格局的分布与应用

AIRIOT

低代码 物联网 低代码,项目开发

教你使用CANN将照片一键转换成卡通风格

华为云开发者联盟

人工智能 CANN 昇腾 卡通

2022年移动应用运营增长洞察白皮书:流量红利消退时代的“破局”之道

科技汇

连续最大和与判断回文

未见花闻

7月月更

力扣第三题——无重复字符的最长子串

为自己带盐

力扣

文档协同工具推荐

Baklib

用代码画时序图!简直太爽了

冉然学Java

Java 代码 UML

话实践,行实干,成实事:“巡礼”数字化的中国大地

脑极体

面试官:Redis&MySQL的三种缓存更新策略是怎样的?

Java全栈架构师

Java MySQL redis 程序员 程序人生

BigQuery和Snowflake谁更适合你?两大数据仓库8个角度逐一对比

雨果

数据中台 数据仓库 DaaS DaaS数据即服务 数据即服务

我有 7种 实现web实时消息推送的方案,7种!

程序员小富

Java springboot websocket 消息系统

C2B模式下优惠券架构演进

转转技术团队

Java 架构 Elastic Search

50个名额限量开放|带着OceanBase年度发布会的消息走来了!

OceanBase 数据库

【Docker 那些事儿】容器监控系统,来自Docker的暴击

Albert Edison

Docker 云计算 Kubernetes 云原生 7月月更

Ceph在手天下我有!

穿过生命散发芬芳

Ceph 7月月更

论文领读|面向机器翻译的多语言预训练技术哪家强?最新进展一睹为快!

澜舟孟子开源社区

人工智能 自然语言处理 机器学习 后端 机器翻译

关于研发效能(41/100)

hackstoic

团队管理

基于 SPICE 协议的硬编推流整合方案在云游戏中的应用

字节跳动视频云技术团队

视频编解码 云游戏

前端之路React学习笔记

恒山其若陋兮

7月月更

接口调试还能这么玩?

Liam

前后端分离 Postman API 接口开发 前后端

融云推出实时社区解决方案,垂直兴趣社交「高级玩家」上线

融云 RongCloud

社交网络 即时通讯IM

开源轻量级 IM 框架 MobileIMSDK v6.2 发布

JackJiang

网络编程 Netty 即时通讯 im开发 开源im

银行业数据安全建设专题分析

易观分析

银行安全

数据治理新动态:欧盟发布数据治理研究报告,对国内有何影响

雨果

数据治理

百度、阿里、腾讯,谁最先倒下?

雨果

数据中台 数据服务

云服务器ECS老用户专享,10余款实例新购低至3.6折

阿里云弹性计算

阿里云 云服务器 ECS

如何使用本地Docker更好地开发?我们总结了这八条经验_语言 & 开发_David Eisinger_InfoQ精选文章