[Memo2011][ITPASS]CPU 過熱への対応
症状
2011/07/12 10:00 頃, ika のディスプレイに
[1795432.558228] CPU1: Temperature/speed normal [1795432.558382] CPU5: Temperature/speed normal [1795432.558382] CPU2: Temperature/speed normal [1795432.558626] CPU3: Temperature above threshold, cpu clock throttled (total events = 1) [1795432.558627] CPU7: Temperature above threshold, cpu clock throttled (total events = 1) [1795432.558627] CPU4: Temperature/speed normal [1795432.558627] CPU0: Temperature/speed normal [1795432.558627] CPU6: Temperature/speed normal
と表示されているのが見つかった. CPU の温度が上がりすぎていたようである.
対処
概要
ika に背面ファンを取り付けた.
センサーの検出
sensors コマンドを使って CPU の温度を確認しようとしたが, センサーが検出されないという旨のエラーが出た. センサーを検出すべく
を参考に作業を行ったが, 検出できなかった.
CPU まわりの掃除
ika の電源を切り,
- CPU ファンのほこり取り
- CPU グリスの塗り直し
を行った後, BIOS を起動して CPU の温度を確認したところ, 55 度程度であった.
CPU の負荷耐性チェック
stress コマンドを 10 分間走らせた.
# stress --cpu 8 --timeout 10m
途中で冒頭のようなメッセージが表示されたため, 負荷耐性チェックを中断して BIOS 画面で CPU の温度を確認したところ, 65 度程度あった. これは改善が必要な数値である.
背面ファンの取り付け
旧 ika の背面ファンを, 現在の ika に取り付け, 再度負荷耐性チェックを行ったところ, 問題なくチェックが終了し, チェック後の CPU の温度も 55 度程度に収まっていた. その後, stress コマンドを 1 時間走らせてみたが, やはり CPU の温度は 60 度未満に収まっていたため, 問題は解決したと思われる.
Keyword(s):
References:[[ITPASS2011]2011年度サーバ構築ログ]