最近、作業ミスによる事故が増えているtuboneです。
昨日ですが、サーバ周りのほこりをとろうと思いまして、邪魔なコンセント類をどかしながら「コロコロ」をかけていたのですが…。
「こいつは携帯とかつながっているコンセントだから抜いていいよな。」そう思って、コンセントをぬいたところ。
[fontsize class=’xxxl’] ブーブー!![/fontsize]
一斉にALMが上がりました。
録画サーバがつながっているコンセントを間違って抜いてしまったのです。
目の前が真っ白になりました。
幸いにも大事に至らず。
幸いにも、録画サーバは仮想マシンとして起動しており、ホスト障害が発生した場合、
クラスタのもう片方にHAする仕組みになっております。今回も録画サーバ自体は隣のサーバに
HAしておりました。
仮想マシンイメージおよび、録画データについてもRAID5の構成で組んでおり、問題なく利用できております。万が一でもスナップショットも1日単位でとっているので被害は少ないでしょう。
終わりに
作業ミス、ヒューマンエラー。こうやって事故が起きると思い知りました。
また、ちゃんとHAクラスタやデータの管理に気を配ることも必要だと再認識しました。