Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Strony: 1
Witam,
Ostatnio niepokojąco często pada mi serwerek na Debianie Squeeze (kernel 3.2.0-0.bpo.4-686-pae). Padają po kolei wszystkie ważne procesy: snmpd, nmbd, ntpd i na końcu nawet ifconfig. Jako że łączę się z serwerem przez SSH, pozostaje mi tylko twardy reset serwera. Na sewerze działa hostap i zauważyłem że przed tymi "cyrkami" rozłączani są wszyscy klienci wifi... Proszę o pomoc w interpretacji poniższych logów i wskazówki:
/var/log/syslog
May 14 21:40:02 debian snmpd[1855]: Connection from UDP: [127.0.0.1]:58173->[127.0.0.1] May 14 21:40:02 debian snmpd[1855]: Connection from UDP: [127.0.0.1]:57735->[127.0.0.1] May 14 21:42:47 debian hostapd: wlan1: STA 00:1c:XX:XX:XX:XX IEEE 802.11: disassociated due to inactivity May 14 21:42:48 debian hostapd: wlan1: STA 00:13:XX:XX:XX:XX IEEE 802.11: disassociated due to inactivity May 14 21:42:48 debian hostapd: wlan1: STA 00:1c:XX:XX:XX:XX IEEE 802.11: deauthenticated due to inactivity May 14 21:44:52 debian kernel: [1306321.340118] INFO: task snmpd:1855 blocked for more than 120 seconds. May 14 21:44:52 debian kernel: [1306321.340158] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:44:52 debian kernel: [1306321.340201] snmpd D c130cd20 0 1855 1 0x00000000 May 14 21:44:52 debian kernel: [1306321.340219] ef55b760 00200082 c10ecde5 c130cd20 efa98ec0 00000000 efa98ec0 35d68000 May 14 21:44:52 debian kernel: [1306321.340242] c141be00 c1498b00 ef55b910 c1498b00 ef55b760 c1498b00 c1498b00 f4c51dc0 May 14 21:44:52 debian kernel: [1306321.340265] f6cc668c f692c628 c1230bde 00000004 c110f0e9 00000000 c11163b9 efa98ec0 May 14 21:44:52 debian kernel: [1306321.340288] Call Trace: May 14 21:44:52 debian kernel: [1306321.340313] [<c10ecde5>] ? seq_open+0x4f/0x6b May 14 21:44:52 debian kernel: [1306321.340333] [<c1230bde>] ? dev_seq_open+0xc/0xe May 14 21:44:52 debian kernel: [1306321.340351] [<c110f0e9>] ? proc_reg_open+0x8c/0xeb May 14 21:44:52 debian kernel: [1306321.340369] [<c11163b9>] ? single_release_net+0x20/0x20 May 14 21:44:52 debian kernel: [1306321.340389] [<c10d6c46>] ? __dentry_open+0x1ab/0x263 May 14 21:44:52 debian kernel: [1306321.340408] [<c12d674e>] ? __mutex_lock_common+0xda/0x12a May 14 21:44:52 debian kernel: [1306321.340423] [<c12d67af>] ? __mutex_lock_slowpath+0x11/0x14 May 14 21:44:52 debian kernel: [1306321.340438] [<c12d6845>] ? mutex_lock+0x17/0x23 May 14 21:44:52 debian kernel: [1306321.340450] [<c12d6845>] ? mutex_lock+0x17/0x23 May 14 21:44:52 debian kernel: [1306321.340465] [<c1234020>] ? dev_ioctl+0x2b/0x59d May 14 21:44:52 debian kernel: [1306321.340484] [<c112e788>] ? security_sk_alloc+0xd/0xf May 14 21:44:52 debian kernel: [1306321.340499] [<c12288f3>] ? sk_prot_alloc+0x7d/0xf5 May 14 21:44:52 debian kernel: [1306321.340519] [<c12716d9>] ? udp_getsockopt+0x35/0x35 May 14 21:44:52 debian kernel: [1306321.340534] [<c1278909>] ? inet_ioctl+0x94/0x97 May 14 21:44:52 debian kernel: [1306321.340553] [<c1225645>] ? sock_ioctl+0x1bb/0x1dd May 14 21:44:52 debian kernel: [1306321.340567] [<c122548a>] ? kernel_sendmsg+0x35/0x35 May 14 21:44:52 debian kernel: [1306321.340581] [<c10e2ed1>] ? do_vfs_ioctl+0x46c/0x4b7 May 14 21:44:52 debian kernel: [1306321.340594] [<c12264fe>] ? sock_alloc_file+0x97/0xeb May 14 21:44:52 debian kernel: [1306321.340608] [<c10d5d2b>] ? fd_install+0x1b/0x38 May 14 21:44:52 debian kernel: [1306321.340620] [<c122656d>] ? sock_map_fd+0x1b/0x20 May 14 21:44:52 debian kernel: [1306321.340632] [<c1226f91>] ? sys_socket+0x42/0x56 May 14 21:44:52 debian kernel: [1306321.340644] [<c1227021>] ? sys_socketcall+0x7c/0x1de May 14 21:44:52 debian kernel: [1306321.340656] [<c10e2f60>] ? sys_ioctl+0x44/0x64 May 14 21:44:52 debian kernel: [1306321.340674] [<c12dbc5f>] ? sysenter_do_call+0x12/0x28 May 14 21:45:01 debian /USR/SBIN/CRON[24372]: (cacti) CMD (/usr/bin/php /var/www/cacti/poller.php > /dev/null 2>&1) May 14 21:46:52 debian kernel: [1306441.340098] INFO: task cupsd:1294 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.340139] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.340181] cupsd D f4fe0840 0 1294 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.340199] ef4c8ea0 00000082 00200200 f4fe0840 efaaa080 00000000 00000000 35d68000 May 14 21:46:52 debian kernel: [1306441.340222] c10e3c0e c1498b00 ef4c9050 c1498b00 ef4c8ea0 c1498b00 c1498b00 efa44ec0 May 14 21:46:52 debian kernel: [1306441.340245] c127198d f6fe3700 000000a7 ef7c5d24 000000a7 00000000 ef7c5ecc f6fe3700 May 14 21:46:52 debian kernel: [1306441.340267] Call Trace: May 14 21:46:52 debian kernel: [1306441.340292] [<c10e3c0e>] ? __pollwait+0x9e/0x9e May 14 21:46:52 debian kernel: [1306441.340314] [<c127198d>] ? udp_send_skb+0x25e/0x2ae May 14 21:46:52 debian kernel: [1306441.340331] [<c1272a66>] ? udp_sendmsg+0x483/0x654 ... May 14 21:46:52 debian kernel: [1306441.340712] INFO: task nmbd:1764 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.340743] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.340783] nmbd D ef59fca4 0 1764 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.340798] ef41c180 00000082 ef59fcf8 ef59fca4 c11f85c4 00000000 ef59fd6a 35d68000 May 14 21:46:52 debian kernel: [1306441.340820] 00000000 c1498b00 ef41c330 c1498b00 ef41c180 c1498b00 c1498b00 00000000 May 14 21:46:52 debian kernel: [1306441.340841] 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 May 14 21:46:52 debian kernel: [1306441.340861] Call Trace: May 14 21:46:52 debian kernel: [1306441.340878] [<c11f85c4>] ? extract_buf+0x8c/0x11b May 14 21:46:52 debian kernel: [1306441.340895] [<c12d674e>] ? __mutex_lock_common+0xda/0x12a ... May 14 21:46:52 debian kernel: [1306441.341184] INFO: task snmpd:1855 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.341214] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.341255] snmpd D c130cd20 0 1855 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.341270] ef55b760 00200082 c10ecde5 c130cd20 efa98ec0 00000000 efa98ec0 35d68000 May 14 21:46:52 debian kernel: [1306441.341292] c141be00 c1498b00 ef55b910 c1498b00 ef55b760 c1498b00 c1498b00 f4c51dc0 May 14 21:46:52 debian kernel: [1306441.341314] f6cc668c f692c628 c1230bde 00000004 c110f0e9 00000000 c11163b9 efa98ec0 May 14 21:46:52 debian kernel: [1306441.341336] Call Trace: May 14 21:46:52 debian kernel: [1306441.341350] [<c10ecde5>] ? seq_open+0x4f/0x6b May 14 21:46:52 debian kernel: [1306441.341366] [<c1230bde>] ? dev_seq_open+0xc/0xe ...May 14 21:46:52 debian kernel: [1306441.342133] INFO: task ifconfig:24369 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.342163] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.342204] ifconfig D 00000000 0 24369 24368 0x00000000 May 14 21:46:52 debian kernel: [1306441.342219] ef606900 00200082 b77b4000 00000000 c14235c0 00000000 f4ee2600 35d68000 May 14 21:46:52 debian kernel: [1306441.342241] c109dec4 c1498b00 ef606ab0 c1498b00 ef606900 c1498b00 c1498b00 ef78f580 May 14 21:46:52 debian kernel: [1306441.342263] 00000070 00000000 f4d03a70 f68a4c4c efa55e7c f68a4cac 00000000 00000000 May 14 21:46:52 debian kernel: [1306441.342284] Call Trace: May 14 21:46:52 debian kernel: [1306441.342303] [<c109dec4>] ? find_get_page+0x19/0x65 May 14 21:46:52 debian kernel: [1306441.342318] [<c10b6c33>] ? __do_fault+0x3ee/0x42b
Ostatnio edytowany przez dave88 (2013-05-14 22:51:45)
Offline
Na innym kernelu próbowałeś?
Ja bym zaktualizowal to stabilne wydanie do stabilnego wydania - czyli do Wheezy.
Przydało by się też memtest zrobić, bo jak większa liczba uslug zdycha, to może być coś z pamiecią.
Względnie byl kiedyś taki bląd w kernelu:
http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=517586
Na początek radzę inne jajo dla próby, najlepiej jakieś dużo mlodsze.
I zastanowić się, czy ten serwerek, i jego pamięć są wystarczające do tego, co mają robić.
Pozdrawiam
;-)
Offline
[quote=Jacekalex]Na innym kernelu próbowałeś?[/quote]
Poprzednio miałem jądro serii 2.6 coś (nie pamiętam dokładnie). Działy się podobne cyrki, serwer potrafił się nawet wyłączyć...
[quote=Jacekalex]Ja bym zaktualizowal to stabilne wydanie do stabilnego wydania - czyli do Wheezy.[/quote]
Też o tym myślałem, tylko jaką mam gwarancję że żadna z usług mi się nie posypie (nie poleci żaden konfig)?
[quote=Jacekalex]Przydało by się też memtest zrobić, bo jak większa liczba uslug zdycha, to może być coś z pamiecią.[/quote]
Memtest robiłem jakiś czas temu, RAM 100 % sprawny.
[quote=Jacekalex]I zastanowić się, czy ten serwerek, i jego pamięć są wystarczające do tego, co mają robić.[/quote]
Serwerek oparty na VIA C7 1000MHz oraz RAM 1GB DDR2 533. Jednak usług mam odpalone znacznie więcej niż te zawarte w logu... Myślisz że zwyczajnie nie daje rady?
Pozdrawiam
Dawid
Offline
@dave88:
Z mojego doświadczenia raczej ciężko jest "zarżnąć" kompa - a i objawy niezbyt pasują, natomiast podobne do powyższego zdarzało mi się na jednej przegrzewającej się karcie WIFi - czy sprzęt posiada jakieś chłodzenie i czy ono działa? Kiedy ostatni był czyszczony sprężonym powietrzem z kurzu i pyłu, do tego pytanko - zasilasz to czymś markowym, czy noname?
Offline
Jeśli chodzi o kartę wifi to jest to model TL-WN722N podpięty przez usb. Nie grzeje się przy tym prawie w ogóle, wykluczam raczej ten element, gdyż przed jej instalacją również następowały zwisy. Serwerek pracuje w prawie sterylnych warunkach (zamknięty w szafie) i oczywiście jest chłodzony aktywnie, temperatury istotnych elementów nie przekraczają 37 st. Zasilanie realizuję za pomocą zasilacza buforowego 12V + aku 5Ah więc ze stabilnością napięć nie mam problemów. Wydaje mi się (chociaż brak 100% powtarzalności), że problemy pojawiają się kiedy zmuszam serwer do przerutowania dużego ruchu (pełni funkcje NAT). Z tym że nie dzieje się to od razu lecz, po kilkunastu minutach (przynajmniej ostatnio tak było).
Ostatnio edytowany przez dave88 (2013-05-16 20:13:58)
Offline
A to nie jest jakiś terminal hp ? np 5720 ? Poszukaj w BIOSie opcji dot oszczędzania energii i je wyłącz.
Offline
Zgadza się to terminal, dokładnie IGEL 4210LX Winestra. Wydaje mi się, że dezaktywowałem wszelkie opcje dot. oszczędzania energii, ale sprawdzę to przy okazji.
Offline
Strony: 1
Time (s) | Query |
---|---|
0.00009 | SET CHARSET latin2 |
0.00004 | SET NAMES latin2 |
0.00093 | SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='18.191.165.192' WHERE u.id=1 |
0.00113 | REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '18.191.165.192', 1732404390) |
0.00043 | SELECT * FROM punbb_online WHERE logged<1732404090 |
0.00060 | DELETE FROM punbb_online WHERE ident='18.218.2.191' |
0.00076 | SELECT topic_id FROM punbb_posts WHERE id=232615 |
0.00004 | SELECT id FROM punbb_posts WHERE topic_id=23530 ORDER BY posted |
0.00077 | SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=23530 AND t.moved_to IS NULL |
0.00006 | SELECT search_for, replace_with FROM punbb_censoring |
0.00130 | SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=23530 ORDER BY p.id LIMIT 0,25 |
0.00073 | UPDATE punbb_topics SET num_views=num_views+1 WHERE id=23530 |
Total query time: 0.00688 s |