お気づきの人がいるかもしれませんが、
現在、けいの開発記録で提供しているWebサービスが全て停止中です。
経緯としては2週間ほど前に、MD RAIDに設定していたHDDの一台が完全に止まりました。
私のサーバーではここに書いてあるように、全てのディスクの最初のパーティションを
RAID0に設定しているため、HDDが一台止まればスワップ不能となり
正常な動作をしなくなります。
何のことはない、ただのHDDの故障です。
HDDを付け替えて、RAID ARRAYに追加すればすぐに復旧可能だよと
その時には考えていました。
その後、RAIDを復旧させるためにCD BOOT可能な
Ubuntuで作業を行っていたところ、復旧がうまくいきません。
おかしいな~と思い、調べてみたところUbuntuって
IDEのディスクもSATAと同じ /dev/sdX に割り振るらしく、
DebianのカーネルだとUbuntuで復旧したデバイスマップって認識しないのね。
おお、何だよUbuntu. 後発の癖にそういう微妙な違いを出すのやめてくれよ~とか
愚痴りながら再起動を繰り返し作業していたところ・・・
やっちまった・・・
恐ろしい破壊行為を行うカーネル xen-hypervisor-3.0.3-1-i386-pae を
誤って起動してしまったのです。
このカーネルはXen用に作られたカーネルでAPTでインストール可能なのですが、
RAIDに対応していないらしく
ルートドライブにある、MD RAID管理下のパーティションを破壊してしまう
恐ろしいカーネルです。
あれ・・・起動時にエラーが出ている・・・おかしいなぁと思ったのもつかの間、
画面には xenカーネルが起動した旨のメッセージが・・・
ご存知のとおり、RAID5はドライブが2つ壊れると復旧不可能となります。
その後は真っ白な灰になった気分で現在に至ると。
ちなみに現在も復旧中ですが、個人で運営していたサーバーであるため予算の関係上、
データは外部メディアにはバックアップを取っておらず
ほとんどのデータは復旧不能となる見込み。
【教訓】
・DebianとUbuntuは似ているようで致命的な違いがある。
Debianを復旧させる場合にはDebian Live Projectで配布しているDebianのCDを使うこと。
・GRUBの管理を徹底すること。
カーネルのリコンパイルのやりすぎで起動候補が大量にある状態でのミスだった。
・カーネルのインストールはバックアップ後に行うこと。
今回のように破壊してしまうカーネルをインストールしてしまうかもしれない。
・APTでのインストール時にカーネルがインストールされないか注意すること。
APTを使用していると、場合によっては数百のパッケージに依存しているパッケージがある。
そういった場合、全てのパッケージを見ないでYesを入力したくなるものだが、
その中にカーネルが含まれているかもしれない。
Template Designed By
ぐらいんだぁ
ぐらいんだぁ