Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Witam
Od jakiś 2 miesięcy mam w intranetowej serwerowni HP ProLianta z 2ma dyskami SATA, od HP. Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ. Niemniej jednak, od jakiegoś czasu logwatch daje mi info o smarcie. Dziś przyszedł bąd Prefailure, no i zaczełem się obawiac o dane. Mam tam radia 1 softwarowego. Obawia mnie głownie to, że te błędy są takie same na obu dyskach, także raid na nic mi się nie zda teraz jeśli pierdzielnie wsio. Co o tym myślicie? Pozatym smart chyba nie obsługuję softwarowego raida coś mi się kojarzy
/dev/sda : Prefailure: Seek_Error_Rate (7) changed to 68, Usage: Airflow_Temperature_Cel (190) changed to 68, 69, Usage: Temperature_Celsius (194) changed to 32, 31, /dev/sdb : Prefailure: Raw_Read_Error_Rate (1) changed to 83, Usage: Airflow_Temperature_Cel (190) changed to 68, 69, 68, 69, Usage: Hardware_ECC_Recovered (195) changed to 28, Usage: Temperature_Celsius (194) changed to 32, 31, 32, 31,
W raidzie nie mam żadnych błędów. Ba, kiedy zrestartowałem smarta,to w logach nie pluje się nic:
Jun 29 10:44:18 hp1 smartd[2890]: smartd received signal 15: Terminated Jun 29 10:44:18 hp1 smartd[2890]: smartd is exiting (exit status 0) Jun 29 10:44:18 hp1 smartd[20297]: smartd version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Jun 29 10:44:18 hp1 smartd[20297]: Home page is http://smartmontools.sourceforge.net/#012 Jun 29 10:44:18 hp1 smartd[20297]: Opened configuration file /etc/smartd.conf Jun 29 10:44:18 hp1 smartd[20297]: Configuration file /etc/smartd.conf parsed. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, opened Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, not found in smartd database. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, is SMART capable. Adding to "monitor" list. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, opened Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, not found in smartd database. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list. Jun 29 10:44:18 hp1 smartd[20297]: Monitoring 2 ATA and 0 SCSI devices Jun 29 10:44:19 hp1 smartd[20299]: smartd has fork()ed into background mode. New PID=20299. Jun 29 10:44:19 hp1 smartd[20299]: file /var/run/smartd.pid written containing PID 20299
A tutaj smartcrtl:
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 083 064 044 Pre-fail Always - 212055273 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 52 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 068 060 030 Pre-fail Always - 6790814 9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 1973 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 52 184 Unknown_Attribute 0x0033 100 100 099 Pre-fail Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 068 066 045 Old_age Always - 32 (Lifetime Min/Max 25/33) 194 Temperature_Celsius 0x0022 032 040 000 Old_age Always - 32 (0 20 0 0) 195 Hardware_ECC_Recovered 0x001a 044 036 000 Old_age Always - 212055273 196 Reallocated_Event_Count 0x0033 100 100 036 Pre-fail Always - 0 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Ostatnio edytowany przez Grzeslaw (2009-06-30 15:06:04)
Offline
[quote=Grzeslaw]Od jakiś 2 miesięcy mam w intranetowej serwerowni [...] Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ[/quote]
nie ma to jak profesjonalne chodzenie serwerowni :-D
co do smarta to on obsluguje fizyczne urzadzenie (nie partycje, nie raidy, nie kontrolery, ale fizyczny dysk)
pozatym bledy masz rozne dla poszczegolnych dyskow, a to ze temp. wacha sie pomiedzy 32 a 31 to raczej malo alarmujace (aczkolwiek nie powinna przekroczyc 33)
Offline
Okey thxi, wsio jasne!
Offline
Nie wszystko jest takie jasne:
5 Reallocated_Sector_Ct 0x0033 100 100 036
196 Reallocated_Event_Count 0x0033 100 100 036
36 Bad sectorów realokowanych do zapasowej puli.
Kolejnych do realokowania brak:
197 Current_Pending_Sector 0x0012 100 100 000
ale przyglądaj się czasem paratmetrom 197 to sektory bad przygotowane do realokowania i miej oko na 5 i 196. Jak przekroczy Ci wartość 100 to wyczerpie się pula zapasowych sektorów i dysk zacznie śmiecić bad sectorami na dysku.
Jak to dysk z serwera to powoli szykuj się do jego wymiany. Takiemu typowi co zaczyna bady łapać nie można ufać.
Offline
Zamów sobie Cron'em nocne sprawdzanie SMART'a z porannym raportem na maila :) i bedziesz wiedział gdy padnie.
Offline
ano. ale masakra dyski nowe hp 2miechy moze maja - i co juz zaczynaja swirowac [;
Zresztą co ciekawe, to dzieje sie na zmiane, raz jeden raz dugi raz oba.
A co o raportów to mam je w mailach z logwatcha codzień.
Offline
Time (s) | Query |
---|---|
0.00019 | SET CHARSET latin2 |
0.00006 | SET NAMES latin2 |
0.00171 | SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='3.144.42.233' WHERE u.id=1 |
0.00064 | UPDATE punbb_online SET logged=1732538905 WHERE ident='3.144.42.233' |
0.00040 | SELECT * FROM punbb_online WHERE logged<1732538605 |
0.00065 | DELETE FROM punbb_online WHERE ident='85.208.96.193' |
0.00078 | SELECT topic_id FROM punbb_posts WHERE id=122358 |
0.00006 | SELECT id FROM punbb_posts WHERE topic_id=14505 ORDER BY posted |
0.00056 | SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=14505 AND t.moved_to IS NULL |
0.00006 | SELECT search_for, replace_with FROM punbb_censoring |
0.00219 | SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=14505 ORDER BY p.id LIMIT 0,25 |
0.00084 | UPDATE punbb_topics SET num_views=num_views+1 WHERE id=14505 |
Total query time: 0.00814 s |