◆復旧いたしました...<(_ _)> [Computer ]
ご迷惑をお掛けいたしました。
なんとか復旧いたしました(させました^^;)
正確には復旧というよりも新鯖構築に。
以前からちまちまと構築していた玄箱Pro(nanoka)に完全移行。
引き続き宜しくお願いいたしますm(_ _)m。
暫くblogを書かない状態になってたけど、そのぶん時間は他のことに充てられるけど、書かないのもなぅ...って気分でした。
以下、役に立たない状況メモ^^;
----------
ということで、まずクラッシュする2週間前、8月末あたりから鯖の調子がなんかおかしいなと感じるようになった。
たまにMovableTypeのcgiが表示できなかったり、ちょっと不安定。
なので、念のためと思い毎週日曜日にWebminからblogのDBをバックアップ。
さらにテキストデータでの吐き出しも実行。
これが功を奏したわけであるが。
そして、クラッシュした日...
いつものようにエントリーを更新しようとしたら、なんかおかしい。
異様に時間がかかるし、その後tmp領域が無い旨のメッセージ。
なのでこれはヤバイと思って、WebminからDBをバックアップしようとしたら同じくtmp領域が無いとのエラーメッセージが出てバックアップ出来無い状態。
まさかと思ってdf -kしてみたら、システム領域が満杯。
数週間前に見たときは余裕あったはずなのに...確かにtmp取れないわな...
とりあえず再起動を思ってrebootと打ってみたら、再起動状態に移行するも再起動できない。
あえなく強制電源OFF(コンセントから抜く)で再起動。
logon画面が出て安心できたのも束の間、今度はlogonしようとしたら弾かれる??
なんで??
logonできない原因がどうも"nologon"というファイルの存在。
どうも起動時や終了時に、他からlogonさせないようにするためのファイルらしい。
rootでlogon可能らしいけど、いきなりrootでlogonなんてできねーよ(w
root以外でlogonしてsuするよね普通は。
logonできないとなると手も足も出せないわけで、HDDもUNIXとしてフォーマットしてあるからWindows系PCでは読めそうにない。
さてどうしたものかと考えて思いついたのがKNOPPIXのCD-ROM版。
CD-ROMから起動することで、簡単にUNIXマシンとしてPCを動かすことができる便利なやつ。
早速DLしてきてCD-ROMに焼いてLOOXでCD-ROMブート。
見事起動、しかもちゃんとLOOXの「各種デバイスを認識していたのには驚き!
なので、玄箱を開けて問題のHDDに手持ちのUSB接続HDDケースを接続。
そしてLOOXにUSBを挿したら、あっさりと認識。
早速探してみるとnologonが居た。
しかしファイル表示画面からでは権限が無くて消せない。
ダメかなと思ったら、コンソールではsuでroot権限になれば消せることが判明。
消せたー^^;
ついでに不要なパッケージのファイルなども削除。
で、なぜ急にHDDが圧迫されたのか調べてみるとkcoreというファイルが500MBもあることが判明。
調べてみたらメモリイメージというかダンプデータのようだけど、なんで64MBしかメモリ積んでないマシンでこなことになるのやら。
しかもコレ特殊で消せない...orz
なのでKNOPPIX側から開放をかけてみたのであるが、これが失敗だったかも^^;
まぁそもそもDebian化のデフォルトのままだったのでシステム領域が2GBしか無かったというのもあるけど、それでも余裕あったのになぅ。
再び玄箱に接続して起動させてみると、またもnologonが生成されたようで、どうにもならない。
しかもその後電源が落ちてDIAGの赤ランプが6回点滅。
こうなるとダメぽ。
も一つの手段として,,,強制EMモードと思い、背面のスイッチを押しながら起動するも全ランプ点滅してるのにHDDから起動してる。
この場合はとりあえず適当なHDDを接続して、背面のボタンを押しながら起動。
今度は成功。
で、念のため「# echo -n 'NGNG' > /dev/fl3」して一旦シャットダウン。
HDDを繋ぎ直して起動、今度はROM起動成功。
ログインIDはroot、パスワードはkuroで、IPアドレスはルータから取得なので注意。
でこの状態からHDDにアクセスしてnologonを削る。
そして「# echo -n 'OKOK' > /dev/fl3」してHDDから起動...残念ながら復旧不能...orz。
この時点で、復旧を断念。
まだHDDそのものが読めなくなったというわけではないのが救いかも。
ここからは玄箱PROの話。
購入してからある程度は構築してたのだけど、MT4.21に移行しようとしたら、再構築でエラー発生。
さらにバックアップしてあったMT3.37のデータをリストアして、MTのアップグレードをかけてみると、不要なテンプレートの削除の段階から進まない。
気になってTOPでプロセス見てみると、cgiが終了してる。
という状態だったので、暫く諦めて放置してました^^;
で、こうなるとこっちで再立ち上げせざるをえなくなったわけで...MT3.37にして再度DBをリストア。
再構築をかけてみると、正常終了。
やったぜ!と思いTOPページを確認してみると...あれ?
月別アーカイブがリストボックスに出てこない?
なのでインデックスページお再構築してみるも効果無し。
個別エントリーを1個更新してみたら、今度は「Can't call method "archive_type" on an undefined value 」が無いとかでCMS.pmがエラーで更新失敗...いや更新できてる。
けどTOPページの月別アーカイブは相変わらず表示されない。
サーバーのエラーログを追ってみると
--------------------------
mysqld got signal 11;
This could be because you hit a bug. It is also possible that this binary
or one of the libraries it was linked against is corrupt, improperly built,
or misconfigured. This error can also be caused by malfunctioning hardware.
We will try our best to scrape up some info that will hopefully help diagnose
the problem, but since we have already crashed, something is definitely wrong
and this may fail.
--------------------------
て、MySQL5.0がシステム的にクラッシュしてるよ...orz
なんどやってもダメだった。
signal 11って致命傷だよなぅ。
試しに再度MySQLをインストールしてもダメ。
apt-getするとこのバージョン(etch6)となるので、バージョンを変えてみることに。
wgetでetch1を取得。
インストールしようとしたらパッケージのバージョンの整合性云々でうまくいかない。
なんとか依存関係をかいくぐってインストールできたものの状況変わらず...orz。
そうなるとMySQL5.0から思い切って4.1に変更。
しかしこれが依存関係複雑でさらに難関。
あれこれwgetしてdpkg -iして、関係がわからなくなってくるとapt-get -f installで調整(笑)
インストールし始めの状態だと強制的に5.0に置き換えようとするけど、ある程度4.1関係をインストールしておけば、4.1に合わせようとしてくれる。
モノ的には若干古くなるのでセキュリティ的に少々不安でもあるがMySQL4.1化完了。
早速DBをリストアして再構築をかけてみると、何のエラーも無く成功!
月別アーカイブもちゃんと表示されてるし。
apt-getで取得できる最新の5.0は玄箱PROと相性が悪い模様。
ちなみに5.1にしようとしてもみたけど、これも難しいので断念した。
これでblog復旧!!
と思い公開モード移行。
あとはApache2のディレクトリ別設定の確認と...やってみたらこれが制御かかってない。
まずいなと思いつつApache2の設定を再確認。
Apache2では各種設定ファイルが分割されててどこに何が書いてあるのやら...
Apacheでは基本的にhttpd.confの1本だけだったのに。
何度かApache2のアクセス設定見直して再起動。
手持ちの携帯やPHSでアクセスして権限を確認、これでOK.
やっと移行できたー^^;;;;
コメント
コアダンプのサイズはulimitとかで設定できたと思うのですがねぇ。
デフォルトは数MB程度しか吐かなかったと記憶してるのでカーネル周りも含めて調整してみては?
それと領域チェックスクリプトを作って閾値超えたらメール送るとかするのがいいと思いますが。。。。
投稿者: ビールはきらい | 2008年10月10日 02:54
さんくすです。
打ってみた。
-------------------------------
nanoka:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
max nice (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) unlimited
max locked memory (kbytes, -l) unlimited
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) unlimited
max rt priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) unlimited
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
nanoka:~#
-------------------------------
unlimitedが多いのでまた後日調整かけてみることにします。
投稿者: まきにゃ | 2008年10月19日 22:40