運転監視の事始
運転監視なんて名前を付けましたが、
- ノード死活監視
- サービス監視
- 負荷状況の記録
- デーモンがいなくなったときに復活させる
- ・・・
とかいろいろあって名目を分けた方が良さそうですが、「ひとまず、やらせて」、という気分なので運転監視とかいう安直な名前にしました。
やりたいこと
- CPU Load Average、Disk使用率、メモリ空き容量の状況をグラフ表示したい。
- 「その瞬間」のデータよりも長期的なデータの推移を見たい
性能評価の仕事にもある程度連動させたほうがいいかなと思っているので、最初はここら辺から攻めようと思います(少なくとも今の時点では)
データ取得が出来るようになってから、復活だとか待機系への切り替えだとかそういうのをやろう(かなぁ)と思います。
実際、そこらへんの自動切換えだとかそういうのが楽しみです。負荷をかける側の立場として、「落とす」のは面白そうだし、逆の立場として「そう簡単には落とされないわよ」「攻撃を受けて落とされてチャンスにフラれても、すぐ復活してやる」というあたりの攻防が面白そうです。
なので、
- 負荷をかける技術
- 負荷に(いろんな意味で)耐える技術
を両輪としてブラッシュアップ(いや、先人へのcatchup)が出来ればな、と考えております。