1: 名無し
 三菱UFJニコスは2018年2月7日、2017年末に発生したシステム障害の原因や影響範囲などについて発表した。同社のクレジットカード「NICOSカード」の基幹システムで、ハードディスク(HDD)が3個故障したのが原因だ。2018年1月末時点で一部の会員に対する請求が遅れているなど、事態を収束しきれていない。

マスターデータから中間加工ファイルを作成するバッチ処理のシステムでHDDが故障し、障害が発生した。三菱UFJニコスによれば、HDD15個で一連の機能を果たしており、そのうち3個が同時に故障した。「2個までの同時障害は自動復旧可能な仕組みを設けていたが、3個の故障は想定外だった」(広報)。同社はシステムやHDDの開発企業を明らかにしていないものの、「発生確率は極めて低いとの報告を受けている」という。

 故障したHDDは、障害が発生した2017年12月26日中に交換したが、利用会員の売上データ処理などに遅れが発生した。一部の利用会員に2重請求が発生したほか、請求が遅れるなどの事態につながった。同社はシステム機器の監視体制を強化するなどして対策を講じるという。
http://itpro.nikkeibp.co.jp/atcl/news/17/020803126/

2: 名無し
んなわけあるカー位

3: 名無し
はいはい、想定外想定外

4: 名無し
糞寒い時期なのに珍しいな

5: 名無し
3個壊れた事が原因じゃなくて、3個同時に壊した何か外的要因を見付けないと再発するんじゃ…

6: 名無し
どうせ二個まで大丈夫だから放置してたんだろ

7: 名無し
HDDが3個同時に  ね。
電源だろ。

8: 名無し
ガチで壊れることもあるとか想像できんのかここの馬鹿は

9: 名無し
ミラーとかいろいろな障害対応機器にしてないのか?
故障率減らす対策

10: 名無し
これまでどう補修してきたかだねぇ。壊れるごとに1つずつ交換していくと
だんだん壊れる確率は上がってくるんだが…

11: 名無し
大昔のメインフレームHDDのほうが壊れないとかw

12: 名無し
ニコスを語った詐欺メールも最近出回ってる
情報も漏れたな
メールにちゃんと本名書かれてる

13: 名無し
核EMPだと 全システムこれだもんな
北朝鮮危険すぎ

14: 名無し
 

こういうのはさ、本当の原因を明らかにしないこともある。
とりあえず出して来た報告はRaid6?の訂正不能エラーだけどさ。

 

15: 名無し
「同時に」ってのがどのくらいかだよなあ
例えば1週間かけて壊れたなら、監視体制が完全に悪い
本当に1秒の狂いもなく同時に壊れたなら、外的要因だからそれを解決しないといかん

偶然では済まされない話

30: 名無し
>>15
文系の経営は馬鹿だからこういうことがわからんのです
対応は講じても原因を追求するという研究心がない

16: 名無し
>7
俺もそう思うけど、そんなしょぼい電源つかうのかな。。原因教えてほしいな

17: 名無し
SDDに変えよう

18: 名無し
SSDです ごめんなさい

19: 名無し
 

ハード的には15HDDで2台故障を許容というのは、
まあNICOS程度の重要性ならいいかなって思うけど、

>一部の利用会員に2重請求が発生したほか、

これはダメっしょ。
ジャーナルとかシステムの欠陥臭い。

それから3台壊れたのも特定の原因が無いか調べた方がいいね。
本当に偶発かどうか。
HDDに負担の大きい周波数の振動が伝わってないかとかだけど。

 

20: 名無し
 

SSDは増えてるよ。法人向けでは多少高くても。

でもクレカ業界は競争が激しいからなあ。

 

21: 名無し
RAID組んでたHDDが2台同時に逝った事はあったわ。
HDDに、データ転送量が一定量に達すると使用不能になる致命的なバグがあった。

Seagateめ…

22: 名無し
15個くらいSSDに替えろや

23: 名無し
何処製だよww

24: 名無し
どうせバラ○ーダやろw

25: 名無し
同一の初期ロットで何か問題あつろたと考えれるよ
多分公表しないけど

39: 名無し
>>25
RAID 製品はロット不良回避するためにシャッフルしてメーカが出荷してくるよ。

>>26
RAIDカードが誤動作して(実際には故障してないのに)HDD故障連発してくれるやつを
引いたことがあるんで、その可能性はあるね。

>>27
3.5インチの HDD なら 2U で12個収容なので、HDDx15構成の場合はエンクロージャ
2台目にHDD3個収容。 これもありうるね。

26: 名無し
同時故障なんて普通ない
ディスクを収容してるハードウェアの問題を疑う

27: 名無し
まあ、電源が原因だろうな。

28: 名無し
3個でシステム障害ってRAID6か何かかしら
SOHOとか小規模オフィスレベルの冗長性だのう

31: 名無し
RAID6での複数HDD故障は、業務用ならありえる話。

品質の悪い某社製のHDDが多数出回っていて、そいつが連鎖的に壊れる糞製品で、ババ抜き状態に陥ってる。

全部、茨城にあるあの会社のせい!!

32: 名無し
昔似たようなことを経験したなぁ。
実際には HDD は故障していないにもかかわらず RAID カードが故障と
みなしてちょいちょい HDD が故障が頻発、データロストしてくれましたよ。
たまたま別サーバ増設時に再発して、新規サーバの RAID カードに
交換してみたら直って原因が発覚したが。

33: 名無し
 

新品で導入すると、

HDDで最初の1台が故障すると、短期間のうちの次々と故障することがよくある。
まあ当たり前なんだけどね。

最初の1台故障でHDD全台入替でもいい気がする。

 

35: 名無し
因みに対策は、バックアップを取るかレプリケーションを構築することな。

金をけちって、ストレージ1台でやろうとするから、こんなことになるんだよ。

警報監視の強化とかは短期的な施策であって全然根本解決にならない。
基幹システムなら、金をかけて2重化しろってこと。
ニコスの担当役員がアホなんだろうな。

36: 名無し
復旧後に重複請求やらかてるあたり、トランザクションDBだと思うので RAID は 10 かな。
3個同時に壊れたとかいってるけど、プレスリリースで対応策のいの一番に監視強化とか
出してる辺り、監視システムの設定忘れなだけだと思う。

37: 名無し
同じロットのHDDは同じタイミングで壊れる。何台並列にしていても無意味

38: 名無し
これがリスク分散の現実

40: 名無し
ニュータニックスのコンバインドサーバーならしのげたんか?

43: 名無し
>>40
Nutanix オンリーでDB組んでも速度でず使い物にならないないから普通は
ストレージだけ外出しにするね。 そうなると Nutanix でもしのげない。

41: 名無し
3台に共通してる部分がなんかしらあるはず

42: 名無し
だから同一メーカーの同時期導入は辞めろと

44: 名無し
Quantum Fireball に違いない!

45: 名無し
シーゲートだな

46: 名無し
同時3個のハードディスクじゃなく
壊れてたけどほったらかし状態だったハードが
3個目でトラブルが出たって言う事でしょ
サーバー的なハードって2個で同じ情報を管理し
1個が壊れても修復が出来るって言う品物

47: 名無し
ここ、予算カツカツだったからなぁ

48: 名無し
これはしょうがない気もするんだが、続報ほしい