東証、障害の原因を特定 「自動切り替えできない設定値になっていた」
東京証券取引所は10月5日、株式売買システム「arrowhead」(アローヘッド)で1日に発生した障害の原因を特定し、4日中に修正したと発表した。
障害は、ストレージ内でメモリ故障が起き、サブ機にも切り替わらなかったことが原因。メモリ故障による障害が起きた際、自動切り替えできない設定値になっていたという。
arrowheadのユーザー情報などを格納するストレージ「共有ディスク装置」の1号機に搭載されたメモリが故障したことに起因。1号機が障害を検知すると、切り替え用設定値に従って自動で2号機に切り替わるはずが、切り替わらなかった。
調査したところ、メモリ故障が原因の障害パターンが発生した際、自動切り替えできない設定値になっていたという。設定値を変更すれば、自動切り替えできることが判明。4日にシステムに適用し、自動切り替えが動作することを確認したという。
稼働前のテストでは、1号機と2号機相互の死活監視を途絶えさせても、自動切り替えできていたという。
https://www.itmedia.co.jp/news/articles/2010/06/news063.html
関連記事:【アカン…】東証システム障害、売買停止の ”原因” がコレwwwwwwwwwwwww
関連記事:【速報】東証でシステムトラブル!!! とんでもないことに・・・・・・
これは責任問題になるんじゃないの?
指摘しなかったレビュアも同罪
見過ごしに気づけない管理職の責任だな
私の推測では
テストするために設定値を書き換えて
テスト終了後に元に戻して無かったんじゃないかな?
あるある
テストしてないらしいぞ
富士通製品ってデフォ値が変なの多いんだよね
バックアップが初期値無効とか普通にある
稼働前にテストしたっきりで以後ずっとノーチェックだったのかな
稼働させたら後は知らなーいくらいのノリだったんだろ
定期的に障害発生しても問題ないかのテストを行うべきだったね
どっちのせいでもないように
作り話し考えてる最中だと思われ
引用元: https://asahi.5ch.net/test/read.cgi/newsplus/1601950783/
1:
名無しのエクサワロスさん
2020年10月07日 10:18
ID:Bf5W0O7y0
返信