Вчера стал зависать сервак под CentOS 5.4
То выдаёт на экран консоли, ну и в лог тоже:
Dec 3 15:50:10 inet kernel: e1000: eth2: e1000_clean_tx_irq: Detected Tx Unit Hang
Dec 3 15:50:10 inet kernel: Tx Queue <0>
Dec 3 15:50:10 inet kernel: TDH <5e>
Dec 3 15:50:10 inet kernel: TDT <5e>
Dec 3 15:50:10 inet kernel: next_to_use <5e>
Dec 3 15:50:10 inet kernel: next_to_clean <b3>
Dec 3 15:50:10 inet kernel: buffer_info[next_to_clean]
Dec 3 15:50:10 inet kernel: time_stamp <100059c52>
Dec 3 15:50:10 inet kernel: next_to_watch <b3>
Dec 3 15:50:10 inet kernel: jiffies <100059fbd>
Dec 3 15:50:10 inet kernel: next_to_watch.status <1>То:
Dec 3 16:00:32 inet kernel: BUG: soft lockup - CPU#0 stuck for 10s! [swapper:0]
Dec 3 16:00:32 inet kernel: CPU 0:
n_hash dm_log dm_mod dm_mem_cache ahci libata sd_mod scsi_mod ext3 jbd uhci_hcd ohci_hcd ehci_hcd
Dec 3 16:00:32 inet kernel: Pid: 0, comm: swapper Not tainted 2.6.18-164.el5xen #1
Dec 3 16:00:32 inet kernel: RIP: e030:[<ffffffff802063aa>] [<ffffffff802063aa>] hypercall_page+0x3aa/0x1000
Dec 3 16:00:32 inet kernel: RSP: e02b:ffffffff8063bf58 EFLAGS: 00000246
Dec 3 16:00:32 inet kernel: RAX: 0000000000000000 RBX: 0000000000000000 RCX: ffffffff802063aa
Dec 3 16:00:32 inet kernel: RDX: 0000000000000001 RSI: 0000000000000000 RDI: 0000000000000001
Dec 3 16:00:32 inet kernel: RBP: 0000000000000000 R08: 000000000000001b R09: 000000010007a21b
Dec 3 16:00:32 inet kernel: R10: ffff880000de43a0 R11: 0000000000000246 R12: 0000000000000000
Dec 3 16:00:32 inet kernel: R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000
Dec 3 16:00:34 inet kernel: FS: 00002b3191f16af0(0000) GS:ffffffff805ca000(0000) knlGS:0000000000000000
Dec 3 16:00:39 inet kernel: CS: e033 DS: 0000 ES: 0000
Dec 3 16:00:44 inet kernel:
Dec 3 16:00:51 inet kernel: Call Trace:
Dec 3 16:00:51 inet kernel: [<ffffffff8029992b>] rcu_pending+0x26/0x50
Dec 3 16:00:51 inet kernel: [<ffffffff8026f4d5>] raw_safe_halt+0x84/0xa8
Dec 3 16:00:51 inet kernel: [<ffffffff8024af5b>] cpu_idle+0x51/0xba
Dec 3 16:00:51 inet kernel: [<ffffffff8026ca50>] xen_idle+0x38/0x4a
Dec 3 16:00:51 inet kernel: [<ffffffff8024afa1>] cpu_idle+0x97/0xba
Dec 3 16:00:51 inet kernel: [<ffffffff80644b05>] start_kernel+0x21f/0x224
Dec 3 16:00:51 inet kernel: [<ffffffff806441e5>] _sinittext+0x1e5/0x1eb
Короче, удалось вяснить, что глючить начинает, тогда когда поднимаются BGP сесии.
Комп зависает, даже в консоле не нажимаются клавиши.
Как только выдёргиваю провайдерский кабель, проблема уходит.Пустил всё напрямую через NAT, и всё работает, но как только поднимаю квагу, так сразу всё виснет.
Подскажите, в чём может быть причина?
Заранее благодарен.
# uname -aВерсия кваги?
># uname -a
>
>Версия кваги?Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux
quagga-0.98.6
>># uname -a
>>
>>Версия кваги?
>
>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>x86_64 x86_64 GNU/Linux
>
>quagga-0.98.6уж очень старая, обнови до 0.99.15
>>># uname -a
>>>
>>>Версия кваги?
>>
>>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>>x86_64 x86_64 GNU/Linux
>>
>>quagga-0.98.6
>
>уж очень старая, обнови до 0.99.15А может сервак не справляется, с количеством маршрутов?
>[оверквотинг удален]
>>>>Версия кваги?
>>>
>>>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>>>x86_64 x86_64 GNU/Linux
>>>
>>>quagga-0.98.6
>>
>>уж очень старая, обнови до 0.99.15
>
>А может сервак не справляется, с количеством маршрутов?не похоже на квагу, что-то в ядре. может, sysctl подкрутить, bgp много памяти под маршруты тратит.
а чего у тебя ядро с поддержкой xen?
>[оверквотинг удален]
>>>>>Версия кваги?
>>>>
>>>>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>>>>x86_64 x86_64 GNU/Linux
>>>>
>>>>quagga-0.98.6
>>>
>>>уж очень старая, обнови до 0.99.15
>>
>>А может сервак не справляется, с количеством маршрутов?рекомендуют echo 60 > /proc/sys/kernel/softlockup_thresh , попробуй
>[оверквотинг удален]
>>>>>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>>>>>x86_64 x86_64 GNU/Linux
>>>>>
>>>>>quagga-0.98.6
>>>>
>>>>уж очень старая, обнови до 0.99.15
>>>
>>>А может сервак не справляется, с количеством маршрутов?
>
>рекомендуют echo 60 > /proc/sys/kernel/softlockup_thresh , попробуйСпасибо, попробую.
>[оверквотинг удален]
>>>>quagga-0.98.6
>>>
>>>уж очень старая, обнови до 0.99.15
>>
>>А может сервак не справляется, с количеством маршрутов?
>
>не похоже на квагу, что-то в ядре. может, sysctl подкрутить, bgp много
>памяти под маршруты тратит.
>
>а чего у тебя ядро с поддержкой xen?Ну как сказать, в самой кваги могли быть проблемы с утечкой памяти и т.п. Я бы попробовал обновиться.
2 T.C.
а что BGP у тебя full view держит?
>[оверквотинг удален]
>>не похоже на квагу, что-то в ядре. может, sysctl подкрутить, bgp много
>>памяти под маршруты тратит.
>>
>>а чего у тебя ядро с поддержкой xen?
>
>Ну как сказать, в самой кваги могли быть проблемы с утечкой памяти
>и т.п. Я бы попробовал обновиться.
>
>2 T.C.
>а что BGP у тебя full view держит?Да.
>[оверквотинг удален]
>>>>quagga-0.98.6
>>>
>>>уж очень старая, обнови до 0.99.15
>>
>>А может сервак не справляется, с количеством маршрутов?
>
>не похоже на квагу, что-то в ядре. может, sysctl подкрутить, bgp много
>памяти под маршруты тратит.
>
>а чего у тебя ядро с поддержкой xen?Незнаю, ядро стандартное из дистрибутива.
А что это на чтото влияет?
>>а чего у тебя ядро с поддержкой xen?
>Незнаю, ядро стандартное из дистрибутива.
>А что это на чтото влияет?Если не используешь xen, то лучше поставь обычное ядро.
>[оверквотинг удален]
>>>>Версия кваги?
>>>
>>>Linux inet 2.6.18-164.el5xen #1 SMP Thu Sep 3 04:03:03 EDT 2009 x86_64
>>>x86_64 x86_64 GNU/Linux
>>>
>>>quagga-0.98.6
>>
>>уж очень старая, обнови до 0.99.15
>
>А может сервак не справляется, с количеством маршрутов?Неможет быть. Т.к. на следующий день заработало как прежде. Сервак загружен на пару процентов, память тоже гуляет.