目次
Atom C2000 に不具合、稼働から18ヶ月以降に不具合が発生する確率が高くなる
Intelが2013年に発売した、サーバー向けAtomプロセッサ、Atom C2000に不具合が発見されたとのこと。
2017/02/09更新;Ciscoが対象機器の交換を開始しました。それにあわせて対象機器も掲載されています。
2017/02/09更新:Synologyの見解について追記しました。
2017/04/27更新:Intelから対策が発表されました。
不具合の内容
Atom C2000を搭載した機器の稼働時間が18ヶ月を過ぎると、不具合が発生する確率が高くなり、システムが起動しなくなったり、動作が停止する可能性が出てくるとのこと。
事の発端
事の発端は、ネットワーク機器メーカーのCiscoが、2016年11月16日以前に販売したルーターやスイッチ等いくかの製品を18ヶ月以上使い続けると、障害が発生する可能性があると発表していました。
当時Ciscoは、原因となったコンポーネントのサプライヤーの名前を公表しませんでした。
Intelからの発表
2017年1月に、IntelはAtom C2000ファミリのチップラインにクロックの欠陥が含まれていることを発表しました。
「System May Experience Inability to Boot or May Cease Operation」というタイトルの記事に、Atom C2000ファミリのLow Pin Countバスクロック出力(LPC_CLKOUT0とLPC_CLKOUT1)が機能しなくなると説明していました。
LPCクロックが機能しなくなると、システムは起動できなくなってしまうとも、その記事では語られていました。
Ciscoも、コンポーネントに障害が発生すると、システムは機能しなくなったり、システムが起動しなくなり、回復することもできなくなるとCiscoのアドバイザリーは述べています。
対象のSKUは
IntelはAtom C2000プロセッサの出荷開始時期などの詳細については、コメントを差し控えています。
どうやら、Atom C2000ファミリのB0ステッピングの物が故障の影響を受けやすいそうで、これらは2013年に出荷開始されています。
対象のSKU
- C2308
- C2338
- C2350
- C2358
- C2508
- C2518
- C2530
- C2538
- C2550
- C2558
- C2718
- C2730
- C2738
- C2750
- C2758
またこれらのAtom C2000ファミリがどれだけ出荷されたか、問題の解決にどれくらいの費用がかかっているか等の質問に対し、Intelはコメントを差し控えています。
Synologyは既に影響を受けている
NASメーカーのSynologyではこの不具合の影響を既に受けており、Atom C2538を搭載した、DS1815+でハードウェア障害が発生していることを報告しています。
Atom C2000チップを採用している他のメーカーには、Asrock、Aaeon、HP、Infortrend、Lanner、NEC、Newisys、Netgate、Netgear、Quanta、Supermicro、ZNYX Networksなどがあげられます。
LPC_CLKOUT0とLPC_CLKOUT1の役割
LPC_CLKOUT0とLPC_CLKOUT1は、ブートROMを含むボード上のハードウェアに重要なタイミング信号を供給しています。
そんなLPC_CLKOUT0とLPC_CLKOUT1の動作が止まってしまうと、起動時の処理が進まなくなるわけですから、システムが起動できなくなります。
今後の対策
Synologyはこの問題に対処すべく、Intelと共同でこの問題について調査していると話しています。
また、対象の機器を使用していても安全ですが、障害や故障が発生した場合は、標準保証の対象とナルので、サポートに連絡して欲しいとのことです。
追記:Ciscoが対象機器の交換を開始
Ciscoが対象機器の交換を開始しました。現在保証が切れていても、2016年11月16日時点で保証があれば、交換に応じるとのこと。
対象機器はこちら:Cisco
Nexus 9000やASA5500シリーズも対象に挙がっています。どちらも基幹ネットワーク機器なので、影響は甚大です・・・
追記:Synologyが見解を発表
SynologyはAtom C2000シリーズを搭載したDiskStationまたはRackStationのモデルの故障率が、Atom C2000を搭載していない同時期に製造された他のモデルと比較して、高くなっているといった事実は確認、認識していないとのことです。
まとめ
久しぶりのCPUエラッタに関するニュースでした。Atom C2000が発表された当初は、省電力サーバーに大いに役に立つと大々的に発表され、今までこうして様々なメーカーが採用してきました。
そんな中で、プロセッサ自体にエラッタが存在したとのニュースは、各メーカーにとって衝撃的なニュースでした。
ソフトウェアのバグであれば、ファームウェアのアップデートなどで解決できますが、ハードウェアエラッタについては、基本的には交換するしか対処方法がありません。
また、Atom C2000が搭載されている機器はどれも、業務向けでかつシステムのコア部分、ネットワークのコア部分で使われている物ですので、仮に交換となっても、システムを一時的に止めたりなど、その影響の大きさは計り知れません。
影響を被るメーカーの中にHPがあげられていますが、確か小型省電力サーバーである、Moonshot Serverに使われていたはずですので、今後対応に追われることになるかと思います。
また、企業向けのNASやファイルサーバーなどにも使われているケースがあるので、最悪の場合重要データのロストにも繋がりかねません。
今後の動きが気になるところです・・・
Source: The register