Вчера начались проблемы, сервер начал глючить с небольшой периодичностью 30-60 сек зависает на 2-3 секунды. До этого год все работало нормально. Установил утилиту iotop http://feyhoa.org.ua/archives/707 которая показала что зависания идут из-за нагрузки на HDD в 100%, а так же при использовании панели управления ISPmanager загрузка файловой системы доходит до 100%.
Скриншот:
http://hostingkartinok.com/image/01201106/6a1b9c82ee0c64b0b1...
На сервере аппаратный RAID 1Заранее благодарен да любую помощь.
> Вчера начались проблемы, сервер начал глючить с небольшой периодичностью 30-60 сек зависает
> на 2-3 секунды. До этого год все работало нормально. Установил утилиту
> iotop http://feyhoa.org.ua/archives/707 которая показала что зависания идут из-за нагрузки
> на HDD в 100%, а так же при использовании панели управления
> ISPmanager загрузка файловой системы доходит до 100%.
> Скриншот:
> http://hostingkartinok.com/image/01201106/6a1b9c82ee0c64b0b1...
> На сервере аппаратный RAID 1
> Заранее благодарен да любую помощь.состояние массива, опции монтирования, файловые системы, свободное место, заполненность памяти, свопа, состояние и настройки кэша?
P.S. а это ничего, что судя по основному потребителю io, RAID вовсе не аппаратный и, к тому же, деградировавший?
P.P.S. об этом ты должен был догадаться сам или самостоятельно, или, воспользовавшись поиском
> Вчера начались проблемы, сервер начал глючить с небольшой периодичностью 30-60 сек зависает
> на 2-3 секунды. До этого год все работало нормально. Установил утилиту
> iotop http://feyhoa.org.ua/archives/707 которая показала что зависания идут из-за нагрузки
> на HDD в 100%, а так же при использовании панели управления
> ISPmanager загрузка файловой системы доходит до 100%.
> Скриншот:
> http://hostingkartinok.com/image/01201106/6a1b9c82ee0c64b0b1...
> На сервере аппаратный RAID 1
> Заранее благодарен да любую помощь.может наоборот? винт кончается, зависает на 2-3сек. оттого и загрузка 100%?
SMART смотрели?
Собираю инфу как могу, RAID контроллер встроенный на нем 2х150 и 2х1000 в 0 рейде
(Root filesystem) Linux Native Filesystem (ext3) LVM VG mapper, LV pdc_hehhaefje1 занято 7%
/var/www Linux Native Filesystem (ext3) /dev/dm-4 занято 60%
То есть место не занято и нагрузки на проц нету, даже наоборот и как видно на скриншоте чтение запись уходит в ноль но нагрузка полная.СМАРТ выключен если доберусь до сервака включу
Параметры монтирования из fstab
# /etc/fstab: static file system information.
#
# <file system> <mount point> <type> <options> <dump> <pass>
proc /proc proc defaults 0 0
/dev/mapper/pdc_hehhaefje1 / ext3 errors=remount-ro,grpquota,usrquota 0 1
/dev/mapper/pdc_hehhaefje5 none swap sw 0 0
/dev/hdb /media/cdrom0 udf,iso9660 user,noauto 0 0
/dev/dm-4 /var/www ext3 defaults,grpquota,usrquota 0 0fdisk -l выдает
Disk /dev/sda: 1000.2 GB, 1000204886016 bytes
255 heads, 63 sectors/track, 121601 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0001cae0Device Boot Start End Blocks Id System
/dev/sda1 * 1 121594 976695297 5 Extended
/dev/sda5 1 121594 976695296 83 LinuxDisk /dev/sdb: 150.0 GB, 150039945216 bytes
255 heads, 63 sectors/track, 18241 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000c9496Device Boot Start End Blocks Id System
/dev/sdb1 * 1 17488 140472328+ 83 Linux
/dev/sdb2 17489 18233 5984212+ 5 Extended
/dev/sdb5 17489 18233 5984181 82 Linux swap / SolarisDisk /dev/sdc: 1000.2 GB, 1000204886016 bytes
255 heads, 63 sectors/track, 121601 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0001cae0Device Boot Start End Blocks Id System
/dev/sdc1 1 121594 976695297 5 Extended
/dev/sdc5 1 121594 976695296 83 LinuxDisk /dev/sdd: 150.0 GB, 150039945216 bytes
255 heads, 63 sectors/track, 18241 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000c9496Device Boot Start End Blocks Id System
/dev/sdd1 * 1 17488 140472328+ 83 Linux
/dev/sdd2 17489 18233 5984212+ 5 Extended
/dev/sdd5 17489 18233 5984181 82 Linux swap / SolarisDisk /dev/dm-0: 149.9 GB, 149972779008 bytes
255 heads, 63 sectors/track, 18233 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x000c9496Device Boot Start End Blocks Id System
/dev/dm-0p1 * 1 17488 140472328+ 83 Linux
/dev/dm-0p2 17489 18233 5984212+ 5 Extended
/dev/dm-0p5 17489 18233 5984181 82 Linux swap / SolarisDisk /dev/dm-1: 143.8 GB, 143843664384 bytes
255 heads, 63 sectors/track, 17487 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00000000Disk /dev/dm-1 doesn't contain a valid partition table
Disk /dev/dm-2: 6127 MB, 6127801344 bytes
255 heads, 63 sectors/track, 744 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00000000Disk /dev/dm-2 doesn't contain a valid partition table
Disk /dev/dm-3: 1000.1 GB, 1000137752576 bytes
255 heads, 63 sectors/track, 121593 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0001cae0Device Boot Start End Blocks Id System
/dev/dm-3p1 * 1 121594 976695297 5 Extended
/dev/dm-3p5 1 121594 976695296 83 LinuxDisk /dev/dm-4: 1000.1 GB, 1000135983104 bytes
255 heads, 63 sectors/track, 121592 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00000000Disk /dev/dm-4 doesn't contain a valid partition table
Если подскажете команды как получить больше информации о состоянии веников буду благодарен, а пока пойду читать маны.
>[оверквотинг удален]
> /dev/dm-3p5
> 1 121594
> 976695296 83 Linux
> Disk /dev/dm-4: 1000.1 GB, 1000135983104 bytes
> 255 heads, 63 sectors/track, 121592 cylinders
> Units = cylinders of 16065 * 512 = 8225280 bytes
> Disk identifier: 0x00000000
> Disk /dev/dm-4 doesn't contain a valid partition table
> Если подскажете команды как получить больше информации о состоянии веников буду благодарен,
> а пока пойду читать маны.перечитайте мое сообщение
Итог сей басни таков что, слабым местом оказались веники на софтовом рейде. Но даже не рейд подвел, а сами диски не выдержали количество запросов. Временное решение проблемы: на серваке оказалось полное логироание апатчем (отключено полностью) что снизило нагрузку + кеширование.
В скором времени покупается аппаратный рейд и адекватные диски под него.
Спасибо за подсказку на узкое место в I/O.