ホーム » スタッフ » 斉藤徹 » Quad Core マシンがメモリエラー

2009年5月
« 4月   6月 »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

最近の投稿(電子情報)

アーカイブ

カテゴリー

Quad Core マシンがメモリエラー

研究費で Quad Core のハイパワー環境として導入した PowerEdge T105 であるが、 OS のインストールから手を焼いた。ひとまずOSが動きだしたのはいいんだけど、 今度は、"aptitude safe-upgrade" あたりを実行しようとすると再起動がかかってしまう。 ネットワークを使う仕事でエラーがでるのかと思い、オンボードEther のドライバ tg3 の ドライバの最新をひろって入れて安定…かと思いきや、やっぱり勝手に再起動。

不安になってきたけど、BIOSの画面で"エラーレポート"の機能に気づき、 LOGを確認すると、"Unrecoverble ECC Memory Error DIMM2,2"が立て続けに 記録されていた。 メモリの初期不良品をつかんでしまったかと思って、ブルーになるが、状況確認のために メモリのスロットを入れ替える。その結果、ちょいと処理をさせても安定している。 しかし、いつ再発するかわからないので、「負荷試験」がわりに、 必要ないけどカーネル再構築とパッケージの追加インストールを行う。 再構築はまだ実行中だけど、過負荷に耐えている。 この雰囲気は、「メモリの接触不良によるECCエラーで、スロット入れ替えにより、 接触不良が改善された」という様子。