進(jìn)程管理工具 Supervisor
要想在終端后臺(tái)常駐進(jìn)程,首先想到的是在命令后加 & 符號(hào),來達(dá)到隱藏程序在后臺(tái)的目的,盡管看起來進(jìn)程已經(jīng)在后臺(tái)運(yùn)行了,實(shí)際上終端會(huì)話關(guān)閉時(shí)進(jìn)程還是會(huì)被 kill 掉,這種問題一般是采用搭配 nohup 命令來解決的,nohup 作用是忽略 SIGHUP 信號(hào),而會(huì)話關(guān)閉時(shí)正好發(fā)送了該信號(hào)給會(huì)話內(nèi)所有運(yùn)行程序,簡(jiǎn)而言之,nohup 命令搭配 & 不僅可以在后臺(tái)運(yùn)行,還不受會(huì)話關(guān)閉的影響。
$ nohup /bin/cat &

那么問題來了,雖然做到了后臺(tái)運(yùn)行,也避免了掛斷操作帶來的影響,但是它避免不了常駐進(jìn)程自己出現(xiàn)問題,一旦它因自身異常終止了進(jìn)程,這對(duì)黃金搭檔就無力回天了。那怎么才能把掛了的常駐進(jìn)程拉起來呢?這就是我們要講的主題 Supervisor。
Supervisor 介紹
Supervisor 是專門用來在類 Unix 系統(tǒng)上監(jiān)控管理進(jìn)程的工具,發(fā)布于 2004 年,雖然名字氣勢(shì)磅礴,但它的志向并不是統(tǒng)籌整個(gè)操作系統(tǒng)的進(jìn)程,而是致力于做一個(gè)聽話的貼身助理,你只需要告訴它要管理的程序,它就按你的要求監(jiān)控進(jìn)程,救死扶傷,保證進(jìn)程的持續(xù)運(yùn)行。

類 Unix 系統(tǒng)就是由 Unix 設(shè)計(jì)風(fēng)格演變出的操作系統(tǒng),除了 Windows 市面上絕大多數(shù)系統(tǒng)都是類 Unix 系統(tǒng)。
官方文檔介紹 Supervisor 是 C/S 架構(gòu)體系,它對(duì)應(yīng)的角色分別為 Supervisorctl 和 Supervisord。后者的主要作用是啟動(dòng)配置好的程序、響應(yīng) Supervisorctl 發(fā)過來的指令以及重啟退出的子進(jìn)程,而前者是 Supervisor 的客戶端,它以命令行的形式提供了一系列參數(shù),來方便用戶向 Supervisord 發(fā)送指令,常用的有啟動(dòng)、暫停、移除、更新等命令。
Supervisor 安裝與配置
安裝 Supervisor 很簡(jiǎn)單,在各大操作系統(tǒng)的軟件包管理器中都可以直接安裝。
$ yum install -y supervisor
安裝好的 Supervisor 配置文件默認(rèn)為 /etc/supervisor.conf,如果找不到配置文件可以通過官方命令生成,該配置文件包含了一個(gè)空的配置目錄 /etc/supervisor.d(不同 OS 可能不一樣),只需在該目錄添加配置文件即可動(dòng)態(tài)擴(kuò)展,所以 supervisor.conf 一般不需要做改動(dòng)。
我們以最簡(jiǎn)單的 cat 命令為例,cat 命令不加參數(shù)會(huì)阻塞住等待標(biāo)準(zhǔn)輸入,所以很適合做常駐進(jìn)程的演示。現(xiàn)在創(chuàng)建一個(gè)配置文件 cat.ini 到 /etc/supervisor.d/,第一行定義程序的名稱,該名稱用來做操作的標(biāo)識(shí),第二行定義命令路徑,它才是程序執(zhí)行的根本命令。
[program:foo]
command=/bin/cat
配置好后,啟動(dòng) supervisord 服務(wù),注意通過 -c 指定 supervisor 的配置文件。
$ supervisord -c /etc/supervisord.conf
當(dāng)然也可以不指定配置路徑,那么它會(huì)按以下順序逐個(gè)搜索配置文件:
- $CWD/supervisord.conf
- $CWD/etc/supervisord.conf
- /etc/supervisord.conf
- /etc/supervisor/supervisord.conf
- ../etc/supervisord.conf
- ../supervisord.conf
如果你是通過 Mac OS 安裝的 Supervisor,可能從上述目錄都找不到配置文件,可以利用官方提供的命令生成配置。
$ echo_supervisord_conf > supervisor.conf
這個(gè)時(shí)候 cat 進(jìn)程應(yīng)該已經(jīng)跑起來了。
$ ps aux | grep /bin/cat
殺掉進(jìn)程,進(jìn)程 id 會(huì)發(fā)生變化,證明 supervisor 又把 cat 拉了起來。
$ sudo kill 9 <進(jìn)程ID>
核心配置講解
配置文件中的選項(xiàng)并不止 command,官方提供了很多配置項(xiàng)。
[program:name]
command=sh /tmp/echo_time.sh
priority=999
numprocs=1
autostart=true
autorestart=true
startsecs=10
startretries=3
exitcodes=0,2
stopsignal=QUIT
stopwaitsecs=10
user=root
log_stdout=true
log_stderr=true
logfile=/tmp/echo_time.log
logfile_maxbytes=1MB
logfile_backups=10
stdout_logfile_maxbytes=20MB
stdout_logfile_backups=20
stdout_logfile=/tmp/echo_time.stdout.log
下面挑選幾個(gè)配置簡(jiǎn)要說明
- command:要執(zhí)行的命令
- priority:執(zhí)行優(yōu)先級(jí),值越高就越晚啟動(dòng),越早關(guān)閉
- numprocs:進(jìn)程數(shù)量
- autostart:是否與 supervisord 一起啟動(dòng)
- autorestart:自動(dòng)重啟
- startsecs:延時(shí)啟動(dòng)時(shí)間,默認(rèn)為 10 秒
- startretries:?jiǎn)?dòng)重試次數(shù),默認(rèn)為 3 次
- exitcodes:當(dāng)程序的退出碼為 0 或 2 時(shí),重啟
- stopsignal:停止信號(hào)
- stopwaitsecs:延時(shí)停止時(shí)間,收到停止指令后多久停止
- user:以哪個(gè)用戶執(zhí)行
動(dòng)態(tài)操作子程序
添加新的程序,只需增加配置文件,然后執(zhí)行 supervisorctl update 即可動(dòng)態(tài)添加新的程序,并不需要重啟 supervisord 服務(wù)。如果出現(xiàn) refused connection 的提示,可能是沒找到配置文件,需要加上配置選項(xiàng)。
$ supervisorctl update
foo1: added process group
刪除同理,remove 時(shí)會(huì)先將進(jìn)程關(guān)閉,再?gòu)牧斜碇幸瞥?/p>
foo1: stopped
foo1: removed process group
如果需要單獨(dú)停止某個(gè)程序,可以使用 stop 命令,stop 后跟的是 program 名稱。
$ supervisorctl stop foo
foo: stopped
當(dāng)然還可以通過 stop all 命令更加暴力的停止所有進(jìn)程。
$ supervisorctl stop all
foo: stopped
foo1: stopped
反之亦然,啟動(dòng)進(jìn)程只需要將 stop 改為 start。
$ supervisorctl start all
連接到某個(gè)進(jìn)程
$ supervisorctl fg <program 名稱>
重啟 supervisord
$ supervisorctl reload
動(dòng)態(tài)加載 supervisor.conf
$ supervisorctl reread
查看所有進(jìn)程運(yùn)行狀況
$ supervisorctl status
Web 界面操作
官方提供了界面操作方式,需要在 supervisor.conf 中去掉 inet_http_server 的注釋。
[inet_http_server] ; inet (TCP) server disabled by default
port=127.0.0.1:9001 ; ip_address:port specifier, *:port for all iface
username=user ; default is no username (open server)
password=123 ; default is no password (open server)
重啟 supervisord。
$ supervisorctl reload
訪問 http://localhost:9001 可以看到 supervisor 的操作界面。

我是平也,這有一個(gè)專注Gopher技術(shù)成長(zhǎng)的開源項(xiàng)目「go home」
感謝大家的觀看,如果覺得文章對(duì)你有所幫助,歡迎關(guān)注公眾號(hào)「平也」,聚焦Go語言與技術(shù)原理。


浙公網(wǎng)安備 33010602011771號(hào)