シンガポールでアジアのエンジニアと一緒にソフトウエア開発をして日々感じること、アジャイル開発、.NET、SaaS、 Cloud computing について書きます。

シンガポール最大の銀行でもシステム障害

»

 日本では、7月初旬に、ゆうちょ銀行のシステム障害が起こり、最近になってその原因がIBMのHDDコントローラの障害と判明したと報道されています。ここシンガポールでも最大の銀行であるDBS Bankで、ATMの障害が同時期に発生しましたが、同じくIBMのディスクが起因とのこと。

 シンガポールでの障害は、障害対応時に使用した作業手順が古いものだったことが原因と報道されています。こちらでの報道内容を、かいつまんで書いてみたいと思います。

(※以下、『 』で囲んだ部分が、報道を筆者が翻訳し、さらに要約したものです)

 『7月5日の月曜、朝3時から10時までの間、シンガポール最大の銀行であるDBS(Development Bank of Singapore)のすべてのATM及び、Internet bankingシステムが長期間使用不能になるシステム障害が発生した』

 下の写真は、毎朝配られる無料の新聞、TODAYの7月14日の朝刊の第1面をスキャンしたものです。DBSのCEOのPiyush Gupta氏が全面的に謝罪したことが記事になっています。この記事や、DBSのホームページには詳しく障害の原因などが書かれています。以下、続けて要約します。

Ccf07172010_00001

 『7月5日の3:00AMに、かねてからインターミッテント障害の警告を出していたIBMのディスクサブシステムの修理作業。つまり部品の交換作業がIBMのエンジニアによって行われた。しかし、そのときに使われた手順が古いものだった。それが原因でシステムの全面障害を引きこした。システムは何層にも渡る2重化の構造になっている。それにもかかわらず、今回のような全面的システムダウンがなぜ発生したのかは、現在IBMと共同して徹底調査中』

 『3:00AMには、その障害がIBMにより報告され、3:40AMにはIBMとDBSのテクニカルサポートチームの支援が開始され、5:20AMにシステムの再起動が試みられ始めた。しかし、うまくいかないので、すべての銀行業務にわたる、ディザスターリカバリーコマンドセンターを起動したが、8:30AMには、10:00AMにシステムが全面再開することが分かったので、全面的なディザスターリカバリーコマンドセンターを実際に使う必要はなかった』

 8月5日になって、この障害を起こしたDBSに対して、MAS(Manetary Authority of Singapore)つまり日本の金融庁に相当するシンガポールの政府機関が、ペナルティとして課した内容が発表されました。記者会見はDBSのCEOのPiyush Guptaと共に、IBM aseanのregional GMである、Cordelia Chung氏をも含めて行われました。ペナルティの内容は、2億3000万シンガポールドルの資本の上積みを命じる、というもの。課された額が銀行にとってどれだけの重みを持つものなのか、小生よく分かりません。それでも多分、相当重いペナルティなのだろうと思います。

 日本のゆうちょ銀行に対して、日本の金融庁が何がしかのペナルティを課すのか否か、よく分かりません。しかし、わたしはシステムを作る側の人間です。あまりきついペナルティはかけないでもらいたいなと思ったりしますが、そうもいかないのでしょうか?

 日本のゆうちょ銀行の障害の原因はIBMのディスクコントローラのファームウェアで障害個所を自動的に切り離す部分のバグが原因だったわけです。それに対して、DBSの障害の原因は障害対策時の作業手順ミスです。自動作業か人手作業か、と両者に違いはあるが、両方とも障害対策のための仕組みに原因があったわけです。24時間100%に近い稼働率で運用することの難しさを、考えさせられます。

 小生、銀行システムの開発に参加した経験はありますが、ここまでの基幹システムの開発は経験がありません(というかなるべく避けてきました)。わたしが得意とする、アジャイル手法を使ったミッションクリティカルなシステムの開発は、不可能とはいえないまでも、かなり難しいからです。信頼性が最優先になってしまうシステム、例えば今回のような銀行のATMシステムの開発は、信頼性を維持するためにかける工数が、並大抵のものではないでしょう。それでもこういう事故が起こってしまう……またまた、考えさせられます。

Comment(2)

コメント

EarlGrey

新聞一面のスキャン画像を公開されるのはあまりよろしくないのでは?
無料紙とはいえ新聞、著作権を放棄しているとは考えにくいのですが・・・

alex

この事件で最も大切なニュースをわすれていると思います。
それは毎朝配られる無料の新聞に、最初IBMはなんと、コメントしたかです。
ハードもソフトもアウトソースしてるから、自分たちの責任でない。

コメントを投稿する