URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 95174
[ Назад ]

Исходное сообщение
"cat /sys/class/scsi_host/host6/state - recovery и завис"

Отправлено CAMOJIET , 07-Ноя-13 04:56 
Бывает, что на моём Debian вышибает жесткие диски. Обычно делаю
echo 1 > /sys/bus/scsi/devices/6:0:0:0/delete (номер правильный)
Отключаю/включаю питание жестяка
echo "0 0 0" > /sys/class/scsi_host/host6/scan
И диск появляется под тем же именем в /dev.
И тут я не выполнил операцию с питанием жесткого диска, и жесткий диск в /dev не появился, ё
папки /sys/bus/scsi/devices/6:0:0:0 не существует, а /sys/class/scsi_host/state - recovery.

Что ещё можно сделать, чтобы можно было остановить ту операцию, которую не может выполнить в данный момент ядро, и просканить жестяк заново?


Содержание

Сообщения в этом обсуждении
"cat /sys/class/scsi_host/host6/state - recovery и завис"
Отправлено pavel_simple , 07-Ноя-13 07:24 
> Бывает, что на моём Debian вышибает жесткие диски. Обычно делаю
> echo 1 > /sys/bus/scsi/devices/6:0:0:0/delete (номер правильный)
> Отключаю/включаю питание жестяка
> echo "0 0 0" > /sys/class/scsi_host/host6/scan
> И диск появляется под тем же именем в /dev.
> И тут я не выполнил операцию с питанием жесткого диска, и жесткий
> диск в /dev не появился, ё
> папки /sys/bus/scsi/devices/6:0:0:0 не существует, а /sys/class/scsi_host/state - recovery.
> Что ещё можно сделать, чтобы можно было остановить ту операцию, которую не
> может выполнить в данный момент ядро, и просканить жестяк заново?

да -- но лучше решить проблему выпадания -- а она при таких симптомах с 90% вероятностью говоhbт об убитом БП -- который в свою очередь поломает процессорные электролиты на мамке(если они есть)


"cat /sys/class/scsi_host/host6/state - recovery и завис"
Отправлено CAMOJIET , 08-Ноя-13 02:56 
>[оверквотинг удален]
>> echo "0 0 0" > /sys/class/scsi_host/host6/scan
>> И диск появляется под тем же именем в /dev.
>> И тут я не выполнил операцию с питанием жесткого диска, и жесткий
>> диск в /dev не появился,
>> папки /sys/bus/scsi/devices/6:0:0:0 не существует, а /sys/class/scsi_host/state - recovery.
>> Что ещё можно сделать, чтобы можно было остановить ту операцию, которую не
>> может выполнить в данный момент ядро, и просканить жестяк заново?
> да -- но лучше решить проблему выпадания -- а она при таких
> симптомах с 90% вероятностью говоhbт об убитом БП -- который в
> свою очередь поломает процессорные электролиты на мамке(если они есть)

Я гляну, хотя блок питания покупал дорогой, с большим запасом мощности. И ещё я подозреваю контроллер. Но первую очередь интересны методы работы с контроллером. Как к примеру привести его в offline. Будет ли это влиять на все жесткие диски контроллера.
Буду гуглить, однако если вдруг кто вспомнит - буду признателен.


"cat /sys/class/scsi_host/host6/state - recovery и завис"
Отправлено name , 08-Ноя-13 08:51 
> да -- но лучше решить проблему выпадания -- а она при таких
> симптомах с 90% вероятностью говоhbт об убитом БП -- который в
> свою очередь поломает процессорные электролиты на мамке(если они есть)

Скорее всего все-таки виноват хард. Некоторые харды в определенных условиях когда находят бэдблок, вместо мягкого lba error уходят в полный ступор. И даже sata reset не помогает, только передерг питания.
Обязательно смотреть smart и сделать long test


"cat /sys/class/scsi_host/host6/state - recovery и завис"
Отправлено CAMOJIET , 08-Ноя-13 11:08 
>> да -- но лучше решить проблему выпадания -- а она при таких
>> симптомах с 90% вероятностью говоhbт об убитом БП -- который в
>> свою очередь поломает процессорные электролиты на мамке(если они есть)
> Скорее всего все-таки виноват хард. Некоторые харды в определенных условиях когда находят
> бэдблок, вместо мягкого lba error уходят в полный ступор. И даже
> sata reset не помогает, только передерг питания.
> Обязательно смотреть smart и сделать long test

Да, возможно. Но я не имею возможности к примеру в этот момент прицепить другой хард. Именно на этот же хост (чтобы он отображался в /dev под тем же именем). После того как я нажал скан - начинается скан, который я не могу никак остановить (только ребутом). Мне нужно знать как его остановить, чтобы например подключить туда рабочий хард. Куда в /proc надо записать единичку, или нолик, чтобы скан остановился?