10月1日は波乱の幕開けとなった、
東京証券取引所。
今回、問題となったシステムは共有ディスクのメモリ障害と報道されています。
と、なるとデータベースのシステムでしょうか。完全冗長化されているはずなのでファイバ・チャネル接続にしろ、NAS接続にしろ、完全なかたちでフェイルオーバーできないパターンでの障害だったと察します。
皆さんのお家の家電製品でもありません? 壊れかけてるんだけど、コンセント入れ直したら生き返ったwとか。
ITシステムのなかで、いちばん厄介なのがこの死にかけ。
なんです。
しかも大規模になればなるほど、2号機へのフェイルオーバーが綱渡りになるわけです。データの整合性チェック(ロールバック)にも時間がかかるし、その前に1号機は”きちんと死んでいる”必要があるわけです。
元請けは富士通と聞いています。政府や行政は国のIT力を高める必要があるといいつつもAWS:アマゾンのクラウドシステムへの乗り換えも有効だとコメントした直後の出来事だけに、今後のシステム開発の行方がきになります。
私もシステム障害対応の当事者となったことが何度もありますが、今回の障害がハードウェアのまさに死にかけ現象だったのなら本当にお気の毒と思っちゃいます。
官僚の方は日本の威信にかけたシステムなのに、どういうことだ!
と言いかねませんが、他の国で使っているシステムも構成もほとんど同一なんです。特に前例がないシステム構成は日本人キライですから。。
なので、諸外国のシステムでも起こりうる障害だと思います。
ドンマイ! 富士通さん。
