【障害】みずほ情報総研17【再編】

このエントリーをはてなブックマークに追加
261非決定性名無しさん
>>203-206

02.システム担当者は、上限値が「STEPS」に存在することを知らなかった。
07.オンラインとバッチの並行処理は想定せず、準備もしていなかった。
08.夜間バッチが異常終了してから19時間もの間、為替未送信の恐れに気付かなかった。
09.取引抑止オペレーションの作業時間を30分と見積もったが、5倍の2時間30分かかった。
10.夜間バッチを中断した後の自動運用手順を用意していなかった。
11.夜間バッチが初期段階で異常終了する場合については想定していなかった。
12.障害対応手順の実効性を確認していなかった。
13.作業の漏れや運用操作ミスが多発した。
14.預金・為替システム群のシステム運用リスクについて、一段階低く見積もっていた。
17.同様のトラブルによって、システムが2日連続で異常終了した。
18.バッチ処理の上限値の設定を、23年間一度も見直さなかった。
19.新サービスを導入する際に、夜間バッチの負荷テストを行っていなかった。
25.日付切り替え処理を失念した。
26.取引履歴(ログ)ファイルの退避を忘れた。
27.ログファイルの容量超過によってSTEPSが異常終了した。
29.システムの基本構造や処理方式などを熟知するシステム要員が決定的に不足していた。
30.障害時に陣頭指揮を執るマネジメント人材が不足していた。

知らなかったとか気づかなかったとか、読んでて赤面