这段时间,去感受了下公司的pxe装机平台。 这边的装机是二次开发过的,加了很多的自定义的模块。一说 pxe装机,大家觉得很简单的事,说来也确实是。但是我们经常会遇见些皮毛又让人蛋疼的事,尤其是批量装机后,让业务线验收的时候,我们要先ping主机,然后ssh测试下,raid配置检查下,初始化下。
有朋友说可以用脚本搞呀,我们也确实是这么搞的,但是还是会出现手忙脚乱的现象,我相信很多也都遇见过,单纯的pxe装机,肯定不会很快的又特别顺利的配置完毕。当一切顺利的时候还好说,但是万一出问题,比如是raid情况,有些是没有初始化,有些是没有根据业务线需求配置各种信息,还有些装完了,ping不通等等。
要做平台话的原因是:
我们不用手忙脚乱的做检测,要让我们知道各个服务器的进度到那里了。 是否重启了,是否划入了装机的vlan,是否收到了dhcp给的ip,是否进行安装,是否配置了ip,是否初始化了,是否部署了berkeros 等等。
前端 handlebars jquery
后端 python
服务 cobbler
平台处理流程:
业务线提需求——领导批准——通告网络组——配置pxe以及收集服务器信息——ipmi控制pxe——自动配置raid——装机——配置ip——获取他要做的事情——初始化信息——测试环境——通告基础运维组——通告业务线
我这里简单说下,要点。
自动化装机一定要格外小心,别他线上的机器给装了,为了确保这一点,有能力的公司,一般都会配置一个vlan ,pxe就在这个vlan中,这个pxe在这vlan中只能和pxe服务器、同级的服务器有通信能力。pxe有双网卡,一个是pxe,另一个是在外面的。有些服务器时常的抽风,重启后会pxe启动,要是你在装机vlan下,他会拿到dhcp的ip和tftp的地址。。。。这就糟了。。。
自动配置raid ,一般都是需要把一堆的raid工具集成到一个小系统里面,类似winpe的东西,这样我们可以在小系统内完成raid的配置。
ipmi管理,现在服务器都有ipmi的东西的,我们通过ipmitool工具对服务器进行重启,以及boot配置,通过浏览器进行console控制。获取他要做的事情,我们在pxe做了一个小server,比如临时的调整,已经信息的收集,脚本的运行。
通告,客户端把所有事都搞完了,给pxe的那个小server发个包,说自己已经完成,申请进入数据vlan,他会给你发个邮件,或者在平台中看到,你点确认后,他会划入数据vlan,装机服务器中有个脚本,一直ping外网,当他能访问外网,就说明 一切都ok了。他会发邮件并给平台发个post数据。这两天我要写个简单demo,来实现页面的数据展现
主要是:
进度的查看,以及系统版本,ks文件,脚本,业务线的选择