Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Właśnie postanowiłem przebadać mój dysk usb za pomocą programu smartc i teraz są na nim błędy.
Wynik działanie polecenia smartctl -a /dev/sdd
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 45) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 251) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 100 100 062 Pre-fail Always - 0 2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline - 0 3 Spin_Up_Time 0x0007 186 186 033 Pre-fail Always - 1 4 Start_Stop_Count 0x0012 097 097 000 Old_age Always - 5815 5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0 7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0 8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline - 0 9 Power_On_Hours 0x0012 079 079 000 Old_age Always - 9448 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 2041 191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 85 193 Load_Cycle_Count 0x0012 075 075 000 Old_age Always - 258868 194 Temperature_Celsius 0x0002 214 214 000 Old_age Always - 28 (Min/Max 8/46) 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0 223 Load_Retry_Count 0x000a 100 100 000 Old_age Always - 0 SMART Error Log Version: 1 ATA Error Count: 4 CR = Command Register [HEX] FR = Features Register [HEX] SC = Sector Count Register [HEX] SN = Sector Number Register [HEX] CL = Cylinder Low Register [HEX] CH = Cylinder High Register [HEX] DH = Device/Head Register [HEX] DC = Device Command Register [HEX] ER = Error register [HEX] ST = Status register [HEX] Powered_Up_Time is measured from power on, and printed as DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes, SS=sec, and sss=millisec. It "wraps" after 49.710 days. Error 4 occurred at disk power-on lifetime: 9445 hours (393 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 10 51 20 a8 92 80 0b Error: IDNF 32 sectors at LBA = 0x0b8092a8 = 192975528 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 da 20 a8 92 80 40 00 00:00:32.821 READ DMA EXT 25 da 28 e8 33 cd 40 00 00:00:26.896 READ DMA EXT 25 da 28 d0 b5 9b 40 00 00:00:26.888 READ DMA EXT 25 da 08 e0 99 79 40 00 00:00:26.830 READ DMA EXT 25 da 08 00 9a 79 40 00 00:00:26.807 READ DMA EXT Error 3 occurred at disk power-on lifetime: 9445 hours (393 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 10 51 f0 50 a9 94 02 Error: IDNF 240 sectors at LBA = 0x0294a950 = 43297104 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 da f0 50 a9 94 40 00 00:00:20.560 READ DMA EXT 25 da 08 40 a9 94 40 00 00:00:20.358 READ DMA EXT 25 da 40 c0 35 97 40 00 00:00:20.353 READ DMA EXT 25 da 20 a0 35 97 40 00 00:00:19.697 READ DMA EXT 25 da 80 a8 37 5e 40 00 00:00:17.171 READ DMA EXT Error 2 occurred at disk power-on lifetime: 393 hours (16 days + 9 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 10 51 08 00 6d 70 04 Error: IDNF 8 sectors at LBA = 0x04706d00 = 74476800 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 00 6d 70 40 00 00:00:04.362 READ DMA EXT 25 03 08 00 6d 70 40 00 00:00:03.008 READ DMA EXT 25 03 08 00 08 cf 40 00 00:00:02.927 READ DMA EXT 25 03 08 00 00 00 40 00 00:00:01.561 READ DMA EXT ef 03 46 00 00 00 00 00 00:00:01.554 SET FEATURES [Set transfer mode]
No i teraz moje pytanie jest takie jak można naprawić ten dysk.
Offline
Argumentami typu Pre-fail ww wynikach się chyba nie musisz zajmować,w moim dyziu takie komunikaty pokazywały się w 2008 roku, teraz mamy 2017 i dyzio chodzi dalej,
chociaż zaliczył:
9 Power_On_Hours 0x0032 058 058 000 Old_age Always - 36900
Po prostu każdy producent ma troszkę inną specyfikację SMART, nie ma jednego zdefiniowanego standardu.
To cały raport z mojego dyzia staruszka:
https://wklej.dug.net.pl/5205
Inna sprawa, że zawsze kupuję dyzie do RAID 24/7 i pracy w datacenter, te są dużo trwalsze (ale też dużo droższe) od zwykłych.
Do szybkiego sprawdzania ważnych aspektów pracy dyzia używam takiego skrypta (wyczesany kiedyś na necie):
#!/bin/bash # # SMARTCTL=`which smartctl 2>/dev/null` if [ -z $SMARTCTL ] || [ ! -x $SMARTCTL ]; then echo "It seems you have no smartmontools installed. Install it to proceed." exit 1 fi function check { tmp=`mktemp` $SMARTCTL -A $1 | sed -r 's/^\s+//g' > $tmp for val in 5 10 11 171 172 177 181 187 188 196 197 198 199 200 231; do print=`egrep "^$val " $tmp | awk '{ print $2" = "$10 }'` if [ ! -z "$print" ]; then echo -n "$1: " if [ `echo $print | awk '{ print $3 }'` != 0 ]; then echo -e "\033[31;2m$print\033[0m" else echo -e "\033[32;2m$print\033[0m" fi fi done echo rm -f $tmp } if [ $# -gt 0 ]; then devices=$@ else devices=`ls /dev/sd[a-z]` fi echo if [ -b /dev/twe0 ]; then check "-d 3ware,0 /dev/twe0" check "-d 3ware,1 /dev/twe0" else for d in $devices; do check $d done fi
Pozdro
Ostatnio edytowany przez Jacekalex (2017-07-17 17:05:47)
Offline
[quote=Jacekalex]Argumentami typu Pre-fail ww wynikach się chyba nie musisz zajmować,w moim dyziu takie komunikaty pokazywały się w 2008 roku, teraz mamy 2017 i dyzio chodzi dalej,
chociaż zaliczył:
9 Power_On_Hours 0x0032 058 058 000 Old_age Always - 36900
Po prostu każdy producent ma troszkę inną specyfikację SMART, nie ma jednego zdefiniowanego standardu.
To cały raport z mojego dyzia staruszka:
https://wklej.dug.net.pl/5205
Inna sprawa, że zawsze kupuję dyzie do RAID 24/7 i pracy w datacenter, te są dużo trwalsze (ale też dużo droższe) od zwykłych.
Do szybkiego sprawdzania ważnych aspektów pracy dyzia używam takiego skrypta (wyczesany kiedyś na necie):[/quote]
Ale ty nie masz żadnych błędów, a ja mam takie
SMART Error Log Version: 1 ATA Error Count: 4
Offline
Zrób test fsck w ten sposób:
z roota:
touch /forcefsck reboot
Po restarcie, w trakcie uruchomienia system powinien sprawdzić wszystkie zamontowane dyski.
Poza tym kiedy kupiłeś ten dysk, co to dokładnie za model.
Ostatnio edytowany przez Jacekalex (2017-07-17 17:12:45)
Offline
[quote=Jacekalex]Zrób test fsck w ten sposób:
z roota:
touch /forcefsck reboot
Po restarcie, w trakcie uruchomienia system powinien sprawdzić wszystkie zamontowane dyski.
Poza tym kiedy kupiłeś ten dysk, co to dokładnie za model.[/quote]
TOURO - HGST
Dysk kupiłem gdzieś tak w 2013 roku.
Ostatnio edytowany przez tomi (2017-07-17 17:18:26)
Offline
Jeżeli to Hitachi, to ta firma robi niezłe dyski, ale przy 4 letnim dysku na rynek konsumencki musisz już robić backupy, czyli spacerek po zapasowy dysk cię nie minie.
Chociaż jeżeli to /dev/sdd - czyli 4 dysk, to konieczność natychmiastowego zakupu zależy trochę od stanu i typu dyziow /dev/sd[a-c].
W każdym razie 4 lata to na zwykły dysk USB nie jest mało (oczywiście sporo zależy od sposobu użytkowania).
Ostatnio edytowany przez Jacekalex (2017-07-17 17:31:43)
Offline
Each Attribute also has a Threshold value (whose range is 0 to 255) which is printed under the heading "THRESH". If the Normalized value is less than or equal to the Threshold value, then the Attribute is said to have failed. If the Attribute is a pre-failure Attribute, then disk failure is imminent.[/quote]
Source: http://smartmontools.sourceforge.net/man/smartctl.8.html
Z tego co widze, nie masz czym się przejmować, dysk jest ok.
Błędy o których mówisz powstały w momencie gdy były jakieś fizyczne problemy w komunikacji - kiepski kabel, źle dociśnięte złącze.
Mam dysk z dokładnie takimi samymi błędami, źle go podłączyłem po wyciągnięciu z pudełka :)
Nie wiem czy i jak da się te komunikaty usunąć ale podejrzewam, ze wymaga do jakiegoś lepszego sprzętu [url=http://www.acelaboratory.com/pc3000.udma.php]PC-3000[/url]
p.s. Jak by kogoś interesowała tabela smart
http://nginx.urbinek.eu/hdd_recovery/tabela_smart.html
A w wolnym czasie, robię noże :)
[img]http://nginx.urbinek.eu/_photos/signature.png[/img]
Offline
Błędy w logu zostają i nie mają znaczenia jeśli numerek nie ulega zwiększeniu -- wykonać pełen skan i co jakiś czas rzucać okiem na log smarta.
Tak poza tym, to dyskowi nic nie dolega ale rozleci się w przeciągu kolejnych 1-2 lat, jak w takim tempie będzie rosło Load_Cycle_Count .
Offline
A mam nadzieję, że dysk jak już będzie się kończył to będzie dawał znać o tym, bo jak miałem taki jeden dysk to on dawał znać o tym, że się kończył ?
Offline
@tomi:
Nikt Ci tego nie zagwarantuje niestety - wszystko zależy od tego CO się zacznie 'kończyć.' Np. u mnie w lapku dali taki szajs (ST100LM024-HN-M101MBB) że wartości SMART dla jednego parametru były przekroczone już chyba po roku (jeszcze na gwarancji, ale nie chciało mi się całego lapa wysyłać bo wróciłby w chooj wie jakim stanie, a poza dyskiem śmigał OK). Objawów żadnych przez 2 kolejne lata to nie dawała, aż pewnego pięknego dnia Windos po prostu nie wstał. LiveCD, SMARTCTL - bad blocki... sposobem destrukcyjnym zmusiłem SMART'a do re-alokacji (tracąc dane z tych bloków, no ale cóż). Windos wstał.
Miesiąc później, to samo - nowe bad blocki, znowu utracone pliki i nerwy. Znowu naprawiłem. Miesiąc później... to samo - wtedy kupiłem SSD a tamten dziad czeka na przetegowanie za pomocą badBlocks i pełny format... ale jakoś nie mam weny.
Inny dysk z kolei, padł mi całkowicie bez żadnych ostrzeżeń - przy włączaniu trzaski praski, stuki, puki i dupa - tak że gwarancji nie masz że SMART cię ostrzeże na 100%.
I wiek dysku ma niewielkie znaczenie wbrew pozorom - mam dyski które mają ponad 10 lat i śmigają jak złoto bez żadnych błędów w SMART, jak i tego dziada o którym wyżej, który sypał się od początku.
@Jacekalex:
Z tą większą trwałością 'serwerówek' to różnie bywa - parę lat temu widziałem test, jakaś firma zrobiła na zasadzie: wzięli 10 dyzi 'dla Kowalskiego', 10 dyzi dla serwerów tych samych firm i zaczęli napierdzielać w warunkach serwerowych i jedne i drugie, czekając aż się coś zwali. Poza Seagate którego dyski 'dla Kowalskiego' padły ZNACZNIE szybciej od dysków konkurencji (zarówno tych 'dla kowalskiego' jak i serwerowych!), reszta padała praktycznie tak samo (czytaj. nie zauważono żeby dyzie 'dla murzynów' miały mniejszą żywotność). Oczywiście wiadomo że serwerówki miały sporo lepsze parametry prędkościowe i latencję, ale wytrzymałości lepszej nie zauważono.
Mnie pod tym artykułem rozwalił wtedy komentarz przedstawiciela Seagate, który był w stylu: 'No tak ale to normalne że nasze dyski 'dla murzynów' padają szybciej - jak chcecie wytrzymałości to kupujcie nasze 2x droższe serwerówk!' - zapomniał tylko debil że dyski 'dla murzyna' innych producentów tez były w teście i przeżyły dobre 30% więcej niż zwykły Seagate. Ja od tamtej pory Seagate omijam szerokim łukiem. Dodać że ten dysk z lapka o którym wyżej pisałem to 'niby' Samsung, ale produkowany przez Seagate właśnie... go figure.
Offline
Statystycznie to średnia żywotność dysku HDD wynosi 10 lat, zatem po 5 latach prawdopodobieństwo, że dysk padnie w następnym roku jest już powyżej 50%. xD A tak poza tym, to Load_Cycle_Count wskazuje w miarę dokładnie żywotność w %, bo dyski standardowo zdychają, gdy mają tutaj wartości 500K-1M (zależy od modelu, producent tę wartość podaje). Skoro tam w raporcie było już 250K i dysk chodził około roku, to za jakieś 2 lata prawdopodobnie padnie.
Offline
Zauważyłem, że na tym dysku zaczęły pojawiać się już błędy typu takiego, że są pliki i katalogi ale ich się nie da się skopiować.
Offline
Time (s) | Query |
---|---|
0.00010 | SET CHARSET latin2 |
0.00004 | SET NAMES latin2 |
0.00092 | SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='3.135.186.233' WHERE u.id=1 |
0.00193 | REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '3.135.186.233', 1738035868) |
0.00055 | SELECT * FROM punbb_online WHERE logged<1738035568 |
0.00069 | DELETE FROM punbb_online WHERE ident='57.141.0.15' |
0.00091 | SELECT topic_id FROM punbb_posts WHERE id=313213 |
0.00175 | SELECT id FROM punbb_posts WHERE topic_id=29747 ORDER BY posted |
0.00058 | SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=29747 AND t.moved_to IS NULL |
0.00018 | SELECT search_for, replace_with FROM punbb_censoring |
0.00119 | SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=29747 ORDER BY p.id LIMIT 0,25 |
0.00376 | UPDATE punbb_topics SET num_views=num_views+1 WHERE id=29747 |
Total query time: 0.0126 s |