fc2ブログ
プロフィール

けい

Author:けい
公開したWebサービス・アプリ一覧はこちら

※2014年12月、私が個人で開発したWebサービス・アプリへの
累計アクセス数は8億を超えました。
負荷対策頑張ります。日々精進していきます!!


■■■ 業務経歴 ■■■
社会人1年目:携帯電話開発。画面周りを1年間
2年目 :海外向け携帯電話ミドルウェア開発
     ブラウザとプロトコルスタック周り
2年目後半~:携帯電話の通信専用チップ開発
3年目:カーナビ。画面周りの開発
3年目後半~:BDビデオカメラ
     組み込みLinux カーネルと
     ドライバの開発。
4年目12月:プロジェクト途中で退社
~ここまではC、またはC++で開発~

~ここからJavaがメインの開発~
4年目1月:Web系の会社に転職
       ~4ヶ月間の研修
5年目5月:製造業向け生産管理システム開発
6年目9月:証券会社向けシステム開発
7年目10月~携帯電話向けコミックサイトの運用・開発
8年目12月:プロジェクト途中で退社

~ここからPHPがメインの開発~
8年目1月~仲介手数料が無料の不動産屋の社内SEに転職
交渉しほぼ完全に裁量労働が可能な立場になる。
業務内容はシステム全般ですが、
最近はSEO対策の作業が多いです。
現在14年目 まだ、しばらくはこの会社に居るつもりです。

あと、全ての記事がリンクフリーです。

最近の記事

過去ログ

全ての記事を表示する

全ての記事を表示する

カテゴリー

FC2カウンター

RSSフィード

HDDの温度の下げ方

2週間ほど前から、自宅のサーバーでなにやらディスクエラーのようなエラーが出始めた。
現在のサーバーを自作したのが、2007年09月であることから、
確かに5台あるHDDのどれかが死んでもおかしくない状況なので、
嫌な予感が頭をかすめつつ調査を行った。

まず、raidのアレイの確認。

lfll@debian:~/src$ cat /proc/mdstat
Personalities : [raid10] [raid6] [raid5] [raid4]
md1 : active raid5 sda2[0] hda2[4] sdd2[3] sdc2[2] sdb2[1]
965056256 blocks level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]

md2 : active raid10 hda1[0] sdd1[4] sdc1[3] sdb1[2] sda1[1]
7329280 blocks 64K chunks 2 near-copies [5/5] [UUUUU]

問題無し。次にfsckにてファイルシステムの確認を行ったが、
これも問題無し。
HDDそのものでエラーは出ていないけれど、何か警告をしているのかと思い、
SMART情報を見てみると、
ST3250410ASのHDDのみ異常な高温となっていることがわかった。

lfll@debian:~/src$ sudo smartctl -A /dev/sdc
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 105 099 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 85
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 086 060 030 Pre-fail Always - 409058607
9 Power_On_Hours 0x0032 082 082 000 Old_age Always - 16636
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 85
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 041 033 045 Old_age Always FAILING_NOW 59 (0 16 67 43)
194 Temperature_Celsius 0x0022 059 067 000 Old_age Always - 59 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 065 052 000 Old_age Always - 231700666
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

Temperature_Celsius の値を見ると最高で67℃に達しており、
このままではお亡くなりになるのも時間の問題だということがわかる。
とりあえず、原因がわかったので以下の対応方法を試してみた。

案1
そもそもこのPCのファンは背面に2つ配置されており、
冷却能力はさほど低くは無い。
前面に配置されているHDDのさらに、前面からのみ吸気を行うように空気の流れをコントロールすれば
自然と冷却されるのでは?と考えて、テープで余分な吸気口をガシガシ塞いでみた。

結果・・・変わりませんでした。
やはり夏の暑さと、5台ものHDDは専用の冷却装置が必要なようです。

案2
それならばと吸気ファンの導入を試してみました。
ところが手元にあった12インチファンでは、冷却能力が追いつかないようで
温度は2度くらいは冷えたのですが、FAILING_NOWは消えないままでした。


結局・・・取り出したのは扇風機!
ケースを開けっ放しにして、もうHDDどころかPC全体を冷やしてます。
HDDの温度低下は劇的で平均して約14℃低下してくれました。
190 Airflow_Temperature_Cel 0x0022 054 034 045 Old_age Always In_the_past 46 (0 40 55 46)
194 Temperature_Celsius 0x0022 046 066 000 Old_age Always - 46 (0 16 0 0)

うん。しかし、どうしたもんだろう・・・
扇風機だと騒音も、消費電力も高く、恒久的な解決策とはしたくないのですが、
吸気ファンの導入で駄目だった以上、他に解決策が思いつかないですねぇ。
水冷っていうのも考えたけれど、ググったらあんまり評判よくないですし。

HDDの温度が下がらなくなったら買い替え時なんでしょうか?
購入直後は確か、こんなに上がってなかったはずなんですよね。

※2010/07/03 追記
吸気ファン・排気ファン共にを風力の強いファンに入れ替えたところ、
さらに温度を下げることが出来ました。
現状、扇風機無しで43度程度で安定して稼動しています。

190 Airflow_Temperature_Cel 0x0022 057 034 045 Old_age Always In_the_past 43 (0 40 43 32)

※2010/07/17 追記
どうやら高温時には様々なディスクエラーが発生していたらしく、
今になって読めないファイルなどがいくつか発見された。
Reallocated_Sector_Ctも高いので、どうやら高温時に結構なディスクエラーが発生していた模様である。
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0

う~ん。どうしようかな。さらに強力な冷却ファンを導入しようか検討中です。
一応、あとで自分で見直せるように現在のsmart情報を貼っておきます。

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 052 043 006 Pre-fail Always - 2641941
3 Spin_Up_Time 0x0003 098 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 528
5 Reallocated_Sector_Ct 0x0033 098 098 036 Pre-fail Always - 105
7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 46003460
9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 9781
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 775
194 Temperature_Celsius 0x0022 051 057 000 Old_age Always - 51 (0 6 0 0)
195 Hardware_ECC_Recovered 0x001a 052 043 000 Old_age Always - 2641941
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 198 000 Old_age Always - 8
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 106 094 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 97
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 086 060 030 Pre-fail Always - 464067038
9 Power_On_Hours 0x0032 081 081 000 Old_age Always - 17118
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 97
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 049 032 045 Old_age Always In_the_past 51 (0 45 51 31)
194 Temperature_Celsius 0x0022 051 068 000 Old_age Always - 51 (0 14 0 0)
195 Hardware_ECC_Recovered 0x001a 055 050 000 Old_age Always - 5656314
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 106 092 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 97
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 086 060 030 Pre-fail Always - 464510016
9 Power_On_Hours 0x0032 081 081 000 Old_age Always - 17200
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 97
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 049 035 045 Old_age Always In_the_past 51 (0 11 51 31)
194 Temperature_Celsius 0x0022 051 065 000 Old_age Always - 51 (0 15 0 0)
195 Hardware_ECC_Recovered 0x001a 068 057 000 Old_age Always - 224784865
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 105 099 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 97
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 086 060 030 Pre-fail Always - 467850342
9 Power_On_Hours 0x0032 081 081 000 Old_age Always - 17127
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 97
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 049 033 045 Old_age Always In_the_past 51 (0 86 51 32)
194 Temperature_Celsius 0x0022 051 067 000 Old_age Always - 51 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 060 052 000 Old_age Always - 5771684
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 105 099 006 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 94
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 086 060 030 Pre-fail Always - 467358152
9 Power_On_Hours 0x0032 081 081 000 Old_age Always - 17155
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 94
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 048 034 045 Old_age Always In_the_past 52 (0 40 52 32)
194 Temperature_Celsius 0x0022 052 066 000 Old_age Always - 52 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 059 054 000 Old_age Always - 16593365
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0


スポンサーサイト



コメント(0)   2010.06.28    [ Myカテゴリ:時事・駄文 ]
Template Designed By
ぐらいんだぁ