障害の主な初期分類子は次のとおりです。
- コンソール ログ
- これには、問題につながるエンタープライズ サーバー システム アクティビティの読みやすい履歴が含まれます。コンロール ログを表示したら、次の作業を行います。
- 情報以外のレベルを持つメッセージを最初に調べます。
- 多くの場合、障害後のエンタープライズ サーバーは、ある程度の時間にわたって引き続き正常に動作しているように見えます。そのため、障害前の 10 ~ 15 分間を詳細に (情報メッセージも含めて) 調べる必要があります。
- プロセスのリスト
- 通信ログで、障害を生じたエンタープライズ サーバーに関連付けられているプロセスを調べます (サーバーがシャットダウンしていなかった場合)。健全なデータ取得におけるリストおよび問題のあるデータ取得におけるリストの間でプロセスの CPU 時間に大きな違いがある場合は、ループを示している可能性があります。
- 共有メモリ領域およびセマフォのリスト
- 異常な数のオブジェクトは、オペレーティング システムの問題を示している可能性があります。これを評価するには、このリストをエンタープライズ サーバー システムが健全な状態にある際に取得したリストと比較します。このリストは、Process Explorer
などのサード パーティ ツールを使用して取得できます。
これらの分類子は、外部症状とともに、下記の障害タイプのいずれかに障害を割り当てるための十分な情報を提供します。