導入事例Case Study

スポット障害対応

背景

お客様のシステム運用環境は、サーバーが500台程稼働しています。そこで、障害が発生したサーバーの機能によっては、多数のサーバーに連鎖的に障害が伝播することがあります。同時に数台~数十台のサーバーからの障害が一斉に報告されるような事態が年に2~3回程度発生しています。


その場合に、対応に当たる要員が不足します。そこで、お客様の人的要員に余裕が無い状況でのサーバーで障害が一斉に発生するような事態には、当社のサービス要員が対応に当たらせていただくことになりました。

概要

当社要員は、通常はシステム基盤構築作業あるいは、システム運用サービスに携わっています。以下は、障害のスポット対応の作業の流れです


契約形態 業務委託
精算方式 実績払い
H23年度対応回数:4回。12人日
要員 最大5名

作業詳細

弊社作業員にて実施しました障害対応の一例を以下に示します

1.MSCS/MSFC(Microsoft Cluster Service/Microsoft Failover Cluster)関連

サーバー/障害 障害原因 対応
クラスターシステムのOS起動不可 クォーラムディスクで利用しているSAN DiskにてI/Oエラーが発生し、極端なスローレスポンスが発生 障害対象Diskを交換し解決。恒久対応策としてI/Oエラー監視ログ機能を追加

2.Active Directory関連

サーバー/障害 障害原因 対応
AD認証を利用するシステムへのログイン不可 ADのバージョンアップによるデフォルト認証方式の差異 ADの認証方式を変更することにより解決

3.VMware vSphere関連

サーバー/障害 障害原因 対応
P2V実施後仮想マシン(Windows)へログイン時にライセンス認証画面が表示される プレ インストール モデルのOSを利用していたため Microsoftライセンスセンターより新しいライセンスキーをいただき適用
※別途Windowsライセンスの準備が必要
P2V実施後仮想マシンが起動しない 移行元サーバがハードウェアベンダー製のprocessorを利用していたため 仮想マシンのHALを正常稼働するものと交換することにより解決

4.DNSサービス関連

サーバー/障害 障害原因 対応
BINDサービスのハングアップ Windows7移行に伴うIPv6トラフィックの発生とBINDサーバのIPv6非対応によるリクエストタイムアウト BINDサーバのIPv6設定を無効化し解決

作業効果

お客様は、保守作業に当たる要員数を最小限に抑えることができます。普段は、別の業務に従事していて「火事場」に駆けつける「消防団方式」とお客様は呼んでおられます。

弊社利用による効果

弊社では幅広いOSをカバーする障害対応が可能で、経験者も豊富です。このような経験を生かして、迅速且つ臨機応変な障害対応が可能となります。

この事例のPDFをダウンロード

「スポット障害対応」のPDFはこちらからダウンロードできます。

この事例をダウンロード

関連事例

お問い合わせ

ご相談・お見積もりのみのご依頼も、お気軽にお問い合わせください。

03-5684-68409:00~17:45(土日、祝日を除く)

お問い合わせはこちら