2008年05月13日

クラスタ切り替え時の注意点

コンピュータ・クラスタパッケージを使ってActive/Standby構成(HA構成)でシステムを稼働させている場合、手動でテイクオーバー(Take Over:稼働系と待機系を切り替える)させる時は、以下の点に注意しましょう。

・稼働系と待機系両方のコンピュータにログイン

・稼働系で正常にサービスが提供されていることを確認
 psコマンドや/var/log/messagesなどで確認。
 その他アプリケーションの正常性確認を実施。

・待機系のシステムログをチェックして異常がないことを確認
 /var/log/messagesなどで確認。

・クラスタパッケージの設定を確認
 稼働系→待機系にテイクオーバー後に稼働系コンピュータの稼働を
 検知した場合、自動的に待機系→稼働系にテイクオーバーする設定
 だと再テイクオーバー時にサービス断が発生するので、そのような
 設定になっているならば設定を解除する。

・クラスタパッケージでテイクオーバー実行

・稼働系のプロセスダウン確認
 psコマンドや/var/log/messagesなどで確認。

・稼働系の共有ディスクmount解除確認
 dfコマンドや/var/log/messagesなどで確認。

・待機系の共有ディスクmount確認
 dfコマンドや/var/log/messagesなどで確認。

・待機系のプロセス稼働確認
 psコマンドや/var/log/messagesなどで確認。

・待機系で正常にサービスが提供されていることを確認
 psコマンドや/var/log/messagesなどで確認。
 その他アプリケーションの正常性確認を実施。

【重要】
クラスタ切り替えなどでコンピュータにログインする時には、シリアルコンソールからログインするようにしましょう。Ethernetインターフェースからログインしていると、何らかのトラブルでコンピュータが再起動した場合にインターフェースがダウンして接続が切断されます。その場合、状況が全くわからなくなってしまいますし、復旧も出来なくなってしまいます。シリアルコンソールからログインしていればエラーメッセージや再起動中のメッセージが表示されるので、復旧の手立てを講ずることも出来ます。リモートでシリアルコンソールからログインするためには事前にコンソールサーバを接続したり、コンピュータ側の設定をする必要がありますが、安全なシステム運用には必要な投資だと私は考えます。

【参考】
手動で稼働系と待機系を切り替えることをテイクオーバー(Take Over)と言いますが、障害で自動的に稼働系と待機系が切り替わることはフェールオーバー(Fail Over、F/O)と言います。

posted by 公爵 at 22:40| Comment(0) | TrackBack(0) | サーバ構築技術 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。