Puppet作为开源的集群管理框架，有着简单易用、快速部署、使用范围广等特性，已经积累了超过250家的用户，包括阿里巴巴、新浪、Oracle等大公司。本文作者将带领大家了解puppet技术及其简单的应用。

背景简介

在传统的服务器集群管理中，每增加一台服务器，都需要对该服务器进行相应的配置。如果服务器数量少，那逐一对服务器进行配置是没问题的。但是在目前的生产环境中，服务器数量动辄就是成千上万台。传统的集群管理方案耗时耗力，已无法快速有效的适应生产环境的需求。目前，在公司内部存在3万多台的web服务器，如何对其进行快速部署成为公司内部亟待解决的问题。主要需求包括：
1.突然有一天，某机房DNS出问题了，需要换个DNS。
2.基于某个模板的业务快速上线。
3.Apache的配置需要将robots文件的配置修改。
4.快速安装某个软件某个模块。
5.修改了某个配置，需要重启对应服务。
6.某天我们对某台机器做某个测试修改了配置，又某天我们对另外一台机器测试又修改了一个配置，越积越多。

如何快速的解决以上情况所引起的生产环境失效的问题，我们对自动化集群管理工具puppet进行了调研，从软件包、配置文件和服务三种类型的资源出发，对服务器集群进行了自动化管理设计。

1 Puppet是什么

Puppet是一种跨平台、C/S架构的集中配置管理系统，可以用于管理linux、windows、unix、mac等平台下的用户、软件包、文件、服务和cron任务等，并且可以妥善处理资源之间的依赖关系。其使用ruby语言开发，但是使用者并不需要了解ruby语言，因为其仅仅依赖于一种以pp为后缀的文件，在puppet框架搭建好后，就只剩下模块的开发，模块开发采用描述性语言和基本的逻辑控制语句，简单易懂，非常适合于管理和部署大规模的集群系统。

2 Puppet架构

Puppet使用C/S架构，分为puppet server（master）和puppet client（agent）。master是配置和管理中心，管理着所有的节点。系统管理员需要在master上编写每个节点所对应的pp文件来描述不同节点的资源集合和目标状态。各个agent会周期性的查询master，来获取自己的配置，并将结果以报告的形式传送给master。

puppet使用ssl认证，在client与master第一次通讯认证通过后，证书会存储在master上，当仅有一台master时，这不会产生问题。但是，在我们的设计中，为了保证高可用和高并发，master是集群，master集群的前面是负载均衡，同一client与master多次通信时，无法保证连接的是同一个master，也就是说无法保证证书的获取。为此，puppet官方建议搭建单独的CA认证服务器，从而实现证书的统一中心化管理。因此在大规模集群管理系统中，常见的puppet架构如上图，本公司同样也采用了该架构搭建集群管理系统。

3 Puppet工作流程

Puppet既可以单机运行，也可以通过C/S架构的方式运行，不过在大多数情况下还是基于C/S架构的方式来运行，其交互过程如下图所示。

1.agent通过ssl向master建立认证。
2.建立认证后，puppet调用agent的facter，探测出主机的一些内置变量，如主机名、系统版本号、ip地址和负载等信息。Agent将这些信息通过ssl加密发送到master端。
3.Master接收到agent的主机信息请求后，根据域名或ip地址将他们发送到本机的manifests或ENC，进行节点配置信息的查询。
4.在解析过程中，首先进行语法检查，如果有语法错误，则停止，返回错误信息，否则继续解析生成catalog。
5.Puppet客户端agent对服务端生成的catalog进行应用。
6.Puppet客户端agent对catalog进行代码验证并执行，并将结果记入日志。
7.将agent信息以报告的形式上报master。
8.流程结束。

4 Puppet安装与配置

基于公司内部已有的DNS域名解析和LVS负载均衡服务，围绕puppet的整个集群管理系统架构图，在centos环境下，puppet安装与配置方法如下：

Master

目前使用了4台master用于管理15000台左右的服务器，如果后期master压力增大，再适当的扩容。配置步骤如下：

1）安装puppet的相关包，包括puppet-server、Apache、mod_ssl、mod_passenger。

在安装以上包的同时，系统会自动安装facter包和一些ruby依赖包。

2）编辑 /etc/puppet/puppet.conf配置文件。

3）复制CA服务器上的证书，主要是打包CA服务器上的ssl目录，并放到master上的ssl目录下。

4）初始化master，生成必须文件。

5）建立/etc/httpd/conf.d/puppet.conf配置文件。

6）创建虚拟主机的DocumentRoot。

7）启动puppet。

CA

将master和agent的认证机制放在单独的CA服务器上，可以方便master集群的管理和扩容。配置步骤如下：

1）安装puppet的相关包，包括puppet-server、Apache、mod_ssl、mod_passenger。

2）编辑/etc/puppet/puppet.conf配置文件。

3）创建/etc/puppet/autosign.conf配置文件，如果内容是“*”，表示所有主机都可访问。

4）启动一下puppet master，实现初始化，生成key和自认证。

5）为master服务器生成证书。

6）建立/etc/httpd/conf.d/puppet.conf配置文件，文件的设置参照master的配置。
7）创建虚拟主机的DocumentRoot，参照master的配置。
8）启动puppet，参照master的配置。

Agent

Puppet客户端安装比较简单，配置步骤如下：

1）安装puppet的相关包，包括addops-puppet、addops-puppet-agent-extra（公司内部包）。其中第一个包为yum源包，第二个包为puppet的扩展包，其依赖于puppet包，并且会自动修改配置文件中的ca_server、server和node_name_value三个变量的值。

2）测试运行：puppet agent --test，默认同步的环境为production，可以手动添加环境参数，如–environment=staging，即可改为临时环境。

5 Puppet配置解读

puppet的主配置文件puppet.conf位于/etc/puppet/（社区版）目录下，其中主要包含了main、master和agent三个命名空间，依次介绍如下：

1）main通用配置选项

confdir：配置文件存放目录，默认在/etc/puppet。
vardir：动态数据存放目录，默认在/var/lib/puppet。
logdir：日志存放目录，默认在/var/log/log。
rundir：PID存放目录，默认在/var/run/puppet。
statedir：状态存放目录，默认在$vardir/state。
ssldir：SSL证书存放目录，默认在$vardir/ssl。
trace：发生错误时显示跟踪信息，默认false。
filetimeout：检测配置文件状态改变的时间周期，单位秒，默认15秒。
syslogfacility：指定syslog功能的级别，默认为daemon级。
manifestdir：系统的启动文件存放目录，默认在/etc/puppet/manifests。
basemodulepath：模块的存放目录，默认为/etc/puppet/modules，可以指定多个。
luginsync：当有自定义facter变量时，需要指定该值为true。
ca_server：认证服务器的名称。

2）Master服务端配置选项

user：后台进程执行的用户。
group：后台进程执行的组。
certname：进行ssl认证时的变量名，默认为主机名。
node_name_value：节点名称，默认为主机名。
mainfest：mainfest站点文件的名字，默认为site.pp。
bindaddress：后台进程绑定的网卡地址接口。
masterport：后台进程执行的端口，默认为8140。
ca：当认证服务器位于单独的服务器上时，需要指定该值为false。

3）Agent客户端配置选项

classfile：显示从服务端加载到的类列表。
localconfig：本地缓存配置目录。
runinterval：客户端的检测时长，默认为30分钟检测一次。
listen：监听进程，用于监听服务端下发的同步信息。
report：值为true时，向master端发送报告。
node_name_value：节点名称，默认为主机名。
certname：认证名称，默认为主机名。
Server：master的认证名称，即certname变量的值。

6 Puppet资源简介

资源是puppet系统的核心，抽象的足够彻底，相似的资源被抽象成了一种资源类型，如程序包资源、文件资源、服务资源和exec资源等。资源属性与其实现方式剥离开来，仅仅描述资源的状态，而不是其具体的实现过程，即可达到资源的同步。

资源定义

资源定义即向资源类型的属性赋值，也称为资源类型的实例化。资源的定义在pp文件中完成，其目录结构一般如下所示：

Files文件夹用于存放该软件包的配置文件，manifests文件夹用于存放资源的实例，即类文件，templates用于存放模板。

定义的资源语法如下：

Type即为资源的类型，比如程序包资源package，文件资源file等，title是一个字符串，在同一类型中必须唯一，每个属性用“，”隔开。通过将class、条件控制语句与资源的定义相结合，即可实现资源的模块化，达到易复用的效果。

常用资源

基于公司内部运维组的需求，puppet主要从程序包、配置文件、服务、exec四个方面展开应用，本文主要对前两种资源展开介绍。另外，我们可以利用“Puppet describe 资源名称”命令查看资源的详细描述。

1）程序包package

Package资源的描述如上图所示，下来我们将对package资源的主要属性进行介绍：

name：包名，可以省略，如果省略，将继承title的值。
ensure：指定软件包的状态，安装、卸载还是升级。需要卸载时，指定为“absent”；需要保证最新版本时，指定为“latest”；需要保证某一版本时，指定为版本号。
source：指定程序包的来源。如果本地yum仓库已经包含该包，则可以不指定。
provider：指明安装方式。

使用案例如下：

其中，package_name和package_ensure是传入的参数值，通过对属性以参数的形式赋值，可以大大提高模块的复用性。

2）配置文件file

file资源的描述如上图所示，下来我们将对file资源的主要属性进行介绍：

ensure：文件的状态，值有absent、present、file、directory和link。
path：文件路径，不指定时为title的值。“ensure=>absent”共用。
owner：文件的属主。
Group：文件的属组。
Mode：文件的权限。
Source：文件来源。

使用案例如下：

服务和exec资源在这里不再赘述，可以利用上述提到的命令，查看资源的详细介绍和参数的使用方法。从以上案例可以看出，采用puppet描述语言，结合常用的逻辑控制语句，可以快速的开发出不同资源的类模块。

7 结论

随着服务器集群规模的增大，公司越来越重视通过自动化配置来减小管理部署的成本。Puppet作为开源的集群管理框架，有着简单易用、快速部署、使用范围广等特性，已经有超过250家的用户，包括Zynga、Twitter、Citrix、Oracle、Shopzilla、Google、RedHat、新浪、阿里巴巴、豆瓣、好乐买、趣游、PPTV等大公司。本文主要介绍了puppet架构、安装方法以及资源的使用案例，属于puppet集群管理的基础篇。随着puppet集群规模的增大，将来我们会继续介绍puppet中的facter工具、hiera工具、模块编写规范、master集群扩展，逐渐搭建一套大规模、健壮的puppet自动化管理集群。

本文转载自公众号360云计算（ID：hulktalk）。

原文链接：

https://mp.weixin.qq.com/s/oitFRUJ_9LGTdRl7HxyVjQ

创作场景

Puppet 自动化集群管理基础篇