大変お世話になっております。
反逆する武士
uematu tubasaです。
初回投稿日時:2021年10月9日(令和3年10月9日)
みずほ銀行でシステム不具合が発生
みずほ銀行で30日午後、システムの不具合により387件の外国為替取引に遅れが出た。
引用元:みずほ銀行、外為取引387件遅れ 今年8度目システム障害
主に法人顧客の送金が滞ったが大半は同日付で処理ができるめどがついたというが一部は翌日に持ち越す可能性がある。
詳細な原因は特定できていない。みずほで顧客に影響が出るシステム障害が明らかになるのは今年に入って8件目。
本日はみずほ銀行のシステム障害において、自他共に認めるポンコツITエンジニアである私が思うところを述べてみたいと思います。
まず、私の友人知人には、IT業界の人間が多く、IT関連の話題などで盛り上がることが多いのですが、昨今のIT業界はリモートワークが多いですし、少人数で何とかする現場も多く、多忙なようですので、みずほ銀行のシステム障害の問題が話題になることはありません。
ただ、銀行系のシステムというのは正確性、保守性、可用性を具備する必要がある堅牢なシステムが求められますから、システム会社も神経をすり減らしてシステムメンテナンスなどを行っているのではないかと推察します。
それでもこのようなシステム障害が発生してしまうわけですから、本当に異常事態が発生していると判断しています。
私のような現場の最前線で頑張っている人間からすると恐怖です。
みずほ銀行の口座を持っておらず、本当に良かったと思っています。
インフラエンジニアを継続雇用することの重要性
保守運用を担うベンダーとの連携も課題だ。
引用元:みずほ幹部「システム使いこなせず」 機器の故障頻発
再発防止策ではベンダー出身者の採用や出向をさらに増やすことも明確にした。
8度の障害のうち、3回は機器の故障が原因だった。
故障の予兆を厳格に管理することも再発防止策に盛り込んだ。
どうやらシステム機器の故障というハードウェアの問題も発生しており、ハード的な問題が発生した場合のバックアップ対処も上手くできず、保守運用者も充実していなかったようです。
システムを安定稼働させ、信頼を取り戻すつもりがあったのか疑いたくなります。
私のように、不器用な人間として本当に怒りを覚えますよ。
システムに強い人間はすぐに育つわけではございません。
様々な教育や研修を経て、様々な修羅場を乗り越え、経験値を貯め、後輩や新人を教育する立場となって、責任感が生まれ、エンジニアとして強靭化するのです。
継続雇用して、お金と時間をしっかりと人材に投下しないからこういったことになります。
また、システム障害が発生することを前提としたバックアップ切り替えも上手くできなかったのは網羅的な対処を講じるという手間と費用を惜しんだからです。
まるで、憲法9条が存在しているから自衛隊を無くせと主張している護憲左翼のような浅はかな民間金融機関です。
スケジュールに余裕を持たせたということか
システムの安定稼働を優先させるため、月内の作業工程を従来計画の半分以下に絞り込んだもよう。
引用元:みずほ、システム作業絞り込み 金融庁に計画提出
これまで起きた障害の再発防止にまつわる改修などを除いて作業を延期する方針も公表した。
11月以降の計画は10月末に提出する。
みずほ銀行は月内の作業工程を従来の半分以下に絞り込んだ模様です。
おそらくスケジュールに余裕を持たせたということなのだと思います。
この判断は素晴らしいのではないでしょうか。
私も経験がございますが、人間はあまりにも時間に追われると正常な判断能力が失われてしまいます。
精神的苦痛が人間としての能力を著しく低下させてしまうのです。
それが原因でミスを重ねてしまい、それで精神的苦痛を受け、さらにミスを重ねるということにもなりかねません。
スパゲティコードと設備投資を怠った末路
みずほは今年2月以降、7回のシステム障害を起こした。
引用元:金融庁・みずほ、背水の陣 システム障害究明へ異例処分
個人利用者のキャッシュカードがATMに吸い込まれただけでなく、企業の外貨建て送金が滞るなどビジネスにも甚大な影響が出た。
問題はシステム障害の原因を完全に特定できていないことだ。
8月の今年5回目の障害は、バックアップなどの処理がきちんと発動できず、店頭の受付業務ができなくなった。
個人利用者のキャッシュカードがATMに吸い込まれただけでなく、外貨建て送金が滞るなどという話は銀行のシステムとして致命的と言えましょう。
さらに、システム障害の原因を完全には特定できていないようです。
ソフトウェア的な障害ということであれば、いわゆるスパゲッティコードということなのではないかと推察します。
スパゲティコードというのは、どのような処理が記述されているのか一見しただけではわからないような複雑なソースコードのことであり、無秩序なシステムメンテナンスが原因であることが多いです。
私も経験がございますが、設計段階からシステムを再構築することで解決できるのですが、それなりに経験年数を重ねたITエンジニアが、それなりに時間とお金を掛けて全面的なシステムメンテナンスを行う必要があり、そんな時間的余裕とお金が無いというのが実情なのでしょう。
単体テスト、結合テスト、総合テスト、運用テスト、そしてソースコードを堅牢にしつつ、外部からのサイバー攻撃に耐えられる仕様に変更し、システム全体を見通すだけの大局観も必要です。
ある意味、民間企業の設備投資抑制によって、ITシステムが負債になってしまった実例と言えましょう。
ちなみに上記のスパゲッティコードに関しては専門的な知見によるものではなく、あくまでも私個人の現場感覚によるところが大きいという点はご了承願います。
※参考記事:生産性向上のために、古いシステムをオブジェクト指向言語で作り直せ
情報系専門学校卒の人間を長期継続雇用した企業が勝利するだろう
私がみずほ銀行の社内情報システムの責任者だったならば、情報系専門学校卒の人間を長期継続雇用するつもりで採用し、外部からどんどん人材を直接雇用するという荒業を繰り出すでしょう。
結局、システム障害を解決するには泥臭い努力と忍耐が必要であり、そのためにはまず人材を確保することが必要なのです。
その人材の内部にノウハウを蓄積していって、他の民間金融機関を圧倒するレベルのシステムを5年以内に構築して安定稼働することを目標とし、システム障害を想定した訓練を日常的に行うべきでしょう。
以上です。