1. 無料アクセス解析

達也の日記

日記です

サーバーの不具合は続く

昨日は二個ある電源ユニットのうち一個を交換した社内サーバーだが、今日は内蔵HDD3台のうちPort0(一台目)がおかしいとのエラーメッセージが。

クラッシュしたわけではないが予兆が有るので早期の交換をお勧めします、みたいなメッセージ。
多分HDDのS.M.A.R.T情報から不良セクタの量などを読み取ってエラーを吐き出してるのだろう。

これも早速東芝に連絡、午後からHDD交換に来てくれることになった。

だが、サーバーの前面扉を開くとHDDが4個入っているうち4台目(Port3)のLEDランプが消灯している。
(一台目がPort0、二台目がPort1、三台目がPort2)あとで東芝の人に訊いて判ったことだがうちのサーバーはHDD×3台でRAID運用してるんだそうだ。

かつ、RAIDのエラーログを見てもらったらPort2が完全に壊れている状態になっているそう。すぐに追っ掛けでPoet0の不具合メッセージが出たため言ってみれば『上書き』されたようなもので画面に表示されたエラーメッセージはPort0の『もうすぐ壊れるかもよ』っていう表示のみだった。

いずれにせよ電源ユニットの故障に始まり、立て続けにHDDユニットの故障である。まぁいきなりクラッシュするよりは良いけれど、そろそろ寿命なんじゃない??

そして、システム使用中でもHDD交換して自動復旧状態になるのがサーバーの強み。

ところが、一時間弱掛かって復旧が終わった、と思ったらすぐにPort3のHDDが同じ状況に。
HDD単体の不具合である可能性も無くはないので、もう一台あった新品のHDDをつないでリトライしたが結局状況変わらず。

これはPort0の(壊れかけというエラー表示がされている)HDDが足を引っ張ってPort3のHDDを壊しているのだろう、という結論に至った(と教えてもらった)。

こうなるともう運用しながらのHDD(RAID)復旧はできず、システムを止めてハードウェアの交換、そしてOSのインストールが必要になるとのこと。

そうなると営業日にはできないので今週末の土日祝にやらざるをえない。

あ~ぁ、祝日出勤(1/12成人の日)決定だよ・・・・・・

押し→読了←てね~
  
スポンサーサイト

コメント

コメントの投稿


管理者にだけ表示を許可する

FC2Ad