Привет всем! Нежна помощь.
Конфигурация системы: сервер с freebsd 4.2, на одной карте локалка, на другой выход в инет. вирусов в сети нет. стоит сквид, самба. ipfw в режиме open, т.е. есть только дивертирование пакетов натом с одной карточки на другую. инет пашет очень хорошо. все вроде работает, НО
есть следующая проблема:
Каждый день около 18-19 часов сервер загружается системными задачами и кирдык. Перезагрузка не помогает. Изменяю системное время (синхронизации через инет нет) - не помогает. Пробовал поиграть со сквидом - тоже самое, вообще отключал из загрузки, но эффекта нет. На следующий день - все опять в норме, но до 18-19. Есть один НЮАНС - при отключении кабеля для инета - сервер оживает (в программе top % занятости уменшается до 0), но как только я его подключаю обратно, сервак опять уходит в задумчивость.
Еще раз повторяю, что вирусов нет - все проверяли причем разными антивирусами, я даже пробовал отключать от сервера локалку, выключал все клиентские машины сети - ничего не помогает. Прослушиваю внешнюю сеть tcpdump - там тишина, программа ни чего не показывает.Кто конкретно гадит пока понять не могу. Люди ПОМОГИТЕ !!!. Куда сунуться, что можно попробовать сделать.
>Привет всем! Нежна помощь.
>Конфигурация системы: сервер с freebsd 4.2, на одной карте локалка, на другой
>выход в инет. вирусов в сети нет. стоит сквид, самба. ipfw
>в режиме open, т.е. есть только дивертирование пакетов натом с одной
>карточки на другую. инет пашет очень хорошо. все вроде работает, НО
>
>есть следующая проблема:
>Каждый день около 18-19 часов сервер загружается системными задачами и кирдык.
>Перезагрузка не помогает. Изменяю системное время (синхронизации через инет нет) -
>не помогает. Пробовал поиграть со сквидом - тоже самое, вообще отключал
>из загрузки, но эффекта нет. На следующий день - все опять
>в норме, но до 18-19. Есть один НЮАНС - при отключении
>кабеля для инета - сервер оживает (в программе top % занятости
>уменшается до 0), но как только я его подключаю обратно, сервак
>опять уходит в задумчивость.
>Еще раз повторяю, что вирусов нет - все проверяли причем разными антивирусами,
>я даже пробовал отключать от сервера локалку, выключал все клиентские машины
>сети - ничего не помогает. Прослушиваю внешнюю сеть tcpdump - там
>тишина, программа ни чего не показывает.
>
>Кто конкретно гадит пока понять не могу. Люди ПОМОГИТЕ !!!. Куда сунуться,
>что можно попробовать сделать.ГДЕ ВЫ ГУРУ, ОТЗОВИТЕСЬ, НЕЖЕН ВАШ HELP !!!!!
Я, конечное, не гуру, но попробуй так1) убери режим open и закрой ipfw + log все что не нужно
2) на время "зависа" включай протоколирования даже того, что разрешено
3) у меня был похожий глюк на SCO, когда из-за проблем с DNS, на который была ссылка, "зависал" мой сервер. Т.е. канал между мной и DNS есть, а вот у него косяк в настройках и он, не имея выхода в инет, пробовал по-очереди все root-сервера. Это я к том, что может глюк не у тебя, а у провайдера, а у тебя уже "отраженка"
4) попробуй инструменты типа соляровских iostat/vmstat и т.п. Они должны быть во FreeBSD и выясни что-именно системное делает твой серверА вообще я склоняюсь к мысле, что нужно рыть в настройках DNS, я бы начал и менно с этого. Насколько я понимаю ты ходишь за именами к провайдеру, а у тебя самого named не запущен. Попробуй взять и в момент зависа убрать из resolv.conf nameserver aaa.bbb.ccc.ddd. Приведу систему к виду "нет DNS серверов - есть только файл hosts" и посмотри результат
>Я, конечное, не гуру, но попробуй так
>
>1) убери режим open и закрой ipfw + log все что не
>нужно
>2) на время "зависа" включай протоколирования даже того, что разрешено
>3) у меня был похожий глюк на SCO, когда из-за проблем с
>DNS, на который была ссылка, "зависал" мой сервер. Т.е. канал между
>мной и DNS есть, а вот у него косяк в настройках
>и он, не имея выхода в инет, пробовал по-очереди все root-сервера.
>Это я к том, что может глюк не у тебя, а
>у провайдера, а у тебя уже "отраженка"
>4) попробуй инструменты типа соляровских iostat/vmstat и т.п. Они должны быть во
>FreeBSD и выясни что-именно системное делает твой сервер
>
>А вообще я склоняюсь к мысле, что нужно рыть в настройках DNS,
>я бы начал и менно с этого. Насколько я понимаю ты
>ходишь за именами к провайдеру, а у тебя самого named не
>запущен. Попробуй взять и в момент зависа убрать из resolv.conf nameserver
>aaa.bbb.ccc.ddd. Приведу систему к виду "нет DNS серверов - есть только
>файл hosts" и посмотри результатВопросик только - убрать из resolv.conf дареса DNS без дальнейшей перезагрузки ?
А так большое СПАСИБО, правда ждать придеться до вечера, пока сервак не отвиснет, а следовательно о результатах смогу сообщить только завтра, когда инет опять запашет или с домашнего отвечу если буду еще жив.
>Вопросик только - убрать из resolv.conf дареса DNS без дальнейшей перезагрузки ?
ну да, конечно. Но учти - после этого у тебя все запросы к DNS уйдут с ошибкой. Ведь у тебя в /etc/hosts нет списка хостов всего интернета? :)> отвиснет, а следовательно о результатах смогу сообщить только завтра, когда
конечно напиши, нужно выявить "врага" и разобраться с ним :)
>>Вопросик только - убрать из resolv.conf дареса DNS без дальнейшей перезагрузки ?
>ну да, конечно. Но учти - после этого у тебя все запросы
>к DNS уйдут с ошибкой. Ведь у тебя в /etc/hosts нет
>списка хостов всего интернета? :)
>
>> отвиснет, а следовательно о результатах смогу сообщить только завтра, когда
>конечно напиши, нужно выявить "врага" и разобраться с ним :)Сейчас открыл resolv.conf и обнаружил, что там нет адресов DNS серверов провайдера, они прописаны в named.conf в строке:
forwarders {
aaa.bbb.ccc.ddd;
};Мне такая конфигурация досталась в наследство от предыдущего сисадмина (связь с ним потеряна).
>Сейчас открыл resolv.conf и обнаружил, что там нет адресов DNS серверов провайдера,
а что там есть?>они прописаны в named.conf в строке:
> forwarders {
> aaa.bbb.ccc.ddd;
ага, значит named на машине таки запущен есть. Посмотри у него протоколы, подними уровень отладки на время "Ч". Это что касаемо версии с глюком DNS.А как насчет проверки по остальным версиям?
>>Сейчас открыл resolv.conf и обнаружил, что там нет адресов DNS серверов провайдера,
>а что там есть?
>
>>они прописаны в named.conf в строке:
>> forwarders {
>> aaa.bbb.ccc.ddd;
>ага, значит named на машине таки запущен есть. Посмотри у него протоколы,
> подними уровень отладки на время "Ч". Это что касаемо версии
>с глюком DNS.
Что значит посмотреть протоколы - какие используются или что ? Я просто не очень понимаю.>А как насчет проверки по остальным версиям?
Жду времени "Ч", осталось немного.
>Что значит посмотреть протоколы - какие используются или что ? Я просто
>не очень понимаю.
1) узнай куда идет протоколирования named либо настрой его, в инете куча информации об этом. После этого, смотришь содержимое протокола - что там есть, какие собщения об ошибках, и т.п.
2) Посмотри /var/log/messages на этот-же предмет, может еще /var/log/cron -
т.е. нужно по протоколам работы системы (man syslogd) попытаться понять, что "сама система" думает об этом. Естественно нужно смотреть протоколы за указанный тобой период времени +/- несколько минут
>>Что значит посмотреть протоколы - какие используются или что ? Я просто
>>не очень понимаю.
>1) узнай куда идет протоколирования named либо настрой его, в инете куча
>информации об этом. После этого, смотришь содержимое протокола - что там
>есть, какие собщения об ошибках, и т.п.
>2) Посмотри /var/log/messages на этот-же предмет, может еще /var/log/cron -
>т.е. нужно по протоколам работы системы (man syslogd) попытаться понять, что "сама
>система" думает об этом. Естественно нужно смотреть протоколы за указанный тобой
>период времени +/- несколько минутПонял, пошел копаться. СПАСИБО. Скоро вернусь.
>>>Что значит посмотреть протоколы - какие используются или что ? Я просто
>>>не очень понимаю.
>>1) узнай куда идет протоколирования named либо настрой его, в инете куча
>>информации об этом. После этого, смотришь содержимое протокола - что там
>>есть, какие собщения об ошибках, и т.п.
>>2) Посмотри /var/log/messages на этот-же предмет, может еще /var/log/cron -
>>т.е. нужно по протоколам работы системы (man syslogd) попытаться понять, что "сама
>>система" думает об этом. Естественно нужно смотреть протоколы за указанный тобой
>>период времени +/- несколько минут
>
>Понял, пошел копаться. СПАСИБО. Скоро вернусь.Кажется нашлось, но окончательно станет ясно только вечером.
Дело оказалось в том, что сетевуха с которой выход в инет - битая. Поставили другую, пока все работает, а старая отказалась работать на машине клиента.
СПАСИБО за помощь.
Посмотрю как пойдет дальше.
>Кажется нашлось, но окончательно станет ясно только вечером.
...
>Посмотрю как пойдет дальше.Не сочти за труд - сообщи о результатах, а?
>>Кажется нашлось, но окончательно станет ясно только вечером.
>...
>>Посмотрю как пойдет дальше.
>
>Не сочти за труд - сообщи о результатах, а?КОНЕЧНО! Осталось немного подождать. Если смогу вевером выйти на связь - то значит оно.
>КОНЕЧНО! Осталось немного подождать. Если смогу вевером выйти на связь - то
а вевером это как? :)) Работать нужно меньше :)
>>КОНЕЧНО! Осталось немного подождать. Если смогу вевером выйти на связь - то
>а вевером это как? :)) Работать нужно меньше :)Все еще работает! (18.45) Значит проблема была в глючной сетевой карте. Доле подгорела, то ли драйвер freebsd кривой, толи она не выдерживала по температуре при нагреве от длительной работе толи еще что.
А на счет работы - работа у менят такая (ухожу обычно около 19-20 часов, а то и позже), сисадмином меня сделали в качестве общественной нагрузки (осчастливили блин). Одно дело ковыряться в юниксом тихими осенними вечерами, а другое дело когда труба зовет.
Спасибо и удачи.
>Все еще работает! (18.45) Значит проблема была в глючной сетевой карте. Доле
>подгорела, то ли драйвер freebsd кривой, толи она не выдерживала по
странно очень. То есть каждый день к 18:00 она нагревалась, а затем, к 20:00 остывала? Может она начинала глючить при увеличении нагрузки на нее?>вечерами, а другое дело когда труба зовет.
за то есть "спортивный" интерес: "успею или съедят" :))Удачи!