Доброго времени суток!
Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен. Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил что состояние дисков откатилось на 20 дней назад. Диски intel ssd в программном raid1.
> Доброго времени суток!
> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
> в программном raid1.Состояние рейда какое? Может быть, что у вас рассыпался рейд, один диск был удален из массива, а после перезагрузки вы загрузились именно с него. Но это лишь домыслы и догадки.
И по каким признакам установили интервал именно в 20 дней?
>> Доброго времени суток!
>> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
>> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
>> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
>> в программном raid1.
> Состояние рейда какое? Может быть, что у вас рассыпался рейд, один диск
> был удален из массива, а после перезагрузки вы загрузились именно с
> него. Но это лишь домыслы и догадки.
> И по каким признакам установили интервал именно в 20 дней?рейд работает и проблем в его работе нет(по крайней мере не заметил). по логам 1с и последним изменениям home
> Доброго времени суток!
> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
> в программном raid1.20 дней назад был сделан снапшот, а после перезагрузки вы опять работаете на основной системе?
>> Доброго времени суток!
>> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
>> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
>> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
>> в программном raid1.
> 20 дней назад был сделан снапшот, а после перезагрузки вы опять работаете
> на основной системе?Снапшот не делал и систему не настраивал на снапшот. Система одна. Не совсем понятен вопрос. И могла ли система (или контроллер дисков) сама себя восстановить на определенный момент?
>>> Доброго времени суток!
>>> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
>>> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
>>> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
>>> в программном raid1.
>> 20 дней назад был сделан снапшот, а после перезагрузки вы опять работаете
>> на основной системе?
> Снапшот не делал и систему не настраивал на снапшот. Система одна. Не
> совсем понятен вопрос. И могла ли система (или контроллер дисков) сама
> себя восстановить на определенный момент?Ситуация подобная описанной вами - может возникнуть если ваши диски лежат на SAN. И вы просто поднялись со старого снимка диска.
На физических дисках- такая ситуация невозможна на уровне блочного устройства.
Только если что-то на уровне ФС сработало.
> На физических дисках- такая ситуация невозможна на уровне блочного устройства.Ну, имеется в виду что вы же утверждаете что не делали снапшота...
>> На физических дисках- такая ситуация невозможна на уровне блочного устройства.
> Ну, имеется в виду что вы же утверждаете что не делали снапшота...Но тут конечно есть еще не до конца изученный вопрос, корректно ли была проведена диагностика?
То что логи 1с оказались "старыми" - не говорит что дисковая подсистема вся была откачена на 20 дней назад.
Исследовать следует логи ОС, особенно те куда пишется запуск событий cron, mail sa и т.д.
Нужно убедится что между датой в 20 дней и моментом перезагрузки в системных логах имеется лакуна надлежащей длинны. Если она там есть - то да, есть основание подозревать что образ диска каким-то образом заменился на состояние на 20 дней назад.
Если же лакуны нет- то речь идет скорее о каких-то конкретных файлах...и особенностях ФС... например вы эти файлы держите на tmp разделе который у вас в памяти сидит. или напрмиер fuse задействована... ребут - и файлы стали той версии которая последний раз сохранялась на диск...
>>> На физических дисках- такая ситуация невозможна на уровне блочного устройства.идея что 20 дней диски ваши не сбрасывали кэши- мне кажется кхм.. несколько экзотичной.
raid1 перестал синхронно писать на оба диска в течение последних 20 дней. Получается 20 дней писал на первый, а после выкл/вкл загрузился со второго. Что могло к этому подтолкнуть?
> raid1 перестал синхронно писать на оба диска в течение последних 20 дней.
> Получается 20 дней писал на первый, а после выкл/вкл загрузился со
> второго. Что могло к этому подтолкнуть?Да что угодно, я об этом вам и говорил, но в логах должна была быть ругань, если бы один из дисков выпал из зеркала.
Но все равно странно, даже если так и произошло, то после перезагрузки оно по идее не должно было запустить синхронизацию. Попробуйте загрузиться со второго диска отдельно
> Доброго времени суток!
> Есть компьютер: Fedora 21, xRDP, 1c 8.3. Компьютер был выключен и включен.
> Когда залогинился заметил отсутствие недавно созданного файла. В дальнейшем обнаружил
> что состояние дисков откатилось на 20 дней назад. Диски intel ssd
> в программном raid1.CMOS часы были на 20 дней назад, а системные по NTP.
При перезагрузке какой-то гад сделал hwclock -s,
XFS/EXT4 вахуе и fsck потёр кого мог из "будущего".
Ещё до "20 дней назад" в fstab прописывал монтирование внешнего usb hdd. Была проблема при загрузке смонтированием этого диска. Восстановил первоначальный fstab. Могло ли это послужить разсинхронизации дисков в raid?
> Ещё до "20 дней назад" в fstab прописывал монтирование внешнего usb hdd.
> Была проблема при загрузке смонтированием этого диска. Восстановил первоначальный fstab.
> Могло ли это послужить разсинхронизации дисков в raid?У вас raid то какой был, аппаратный или программный...
>> Ещё до "20 дней назад" в fstab прописывал монтирование внешнего usb hdd.
>> Была проблема при загрузке смонтированием этого диска. Восстановил первоначальный fstab.
>> Могло ли это послужить разсинхронизации дисков в raid?
> У вас raid то какой был, аппаратный или программный...Программный raid1.
>>> Ещё до "20 дней назад" в fstab прописывал монтирование внешнего usb hdd.
>>> Была проблема при загрузке смонтированием этого диска. Восстановил первоначальный fstab.
>>> Могло ли это послужить разсинхронизации дисков в raid?
>> У вас raid то какой был, аппаратный или программный...
> Программный raid1.еще через 10'ть сообщений выяснится что fakeraid через dmraid...
Чтобы получить совет или какие-то более конкретные рекомендации,
следует правильно подать информацию, ибо как всегда - ничего не делал,
нет, все же делал... но это не должно влиять... диски не проверял... они
хорошие... вырубилось электричество... слетел bios и тд и тп:
(все как всегда - оно само... бяка...)железо такое-то (bios - возможные настройки)
расписывают что дано:
- OS ...
- raid такой-то офрмлен так-то
- конфиг и состояние raid
- логи, выдержки из логов
- желательно лог до происшествия и после
- все верхнее с конкретным выводом команд...Вам на все это намекнули, а Вы как в интермедии и передаче:
1)
- Доктор у меня это...
- Что это?
- Ну это...
- Вы то знаете...
- Я то знаю, но не скажу
2)
- Ждите вопроса...
- Ждите ответа...Sorry, без обид.
Мат. плата: Supermicro X9SCL-F
Диски: Intel SSDSC2BB240G7 -2 шт.Fedora 21 32bit c PAE. Настройки по умолчанию, кроме отключил selinux, firewall.
Диски разбивал через anaconda при установки ОС. С начала сделал swap в raid1. Потом сделал lvm c 2 разделами для / и /boot так же в raid1. (Приложил лог anaconda, не уверен в понятном изложении своих действий).
$ cat /proc/mdstat
Personalities : [raid1]
md126 : active raid1 sda2[0] sdb2[1]
1049536 blocks super 1.0 [2/2] [UU]
bitmap: 0/1 pages [0KB], 65536KB chunkmd127 : active raid1 sda3[0]
188743680 blocks super 1.2 [2/1] [U_]
bitmap: 2/2 pages [8KB], 65536KB chunkunused devices: <none>
$ mdadm --detail --scan --verbose
ARRAY /dev/md/root level=raid1 num-devices=2 metadata=1.2 name=term.local:root UUID=5900064c:f7ddf537:d0cc9256:1af66de2
devices=/dev/sda3
ARRAY /dev/md/boot level=raid1 num-devices=2 metadata=1.0 name=term.local:boot UUID=25d8a548:4c718475:189f635a:4d56c4f7
devices=/dev/sda2,/dev/sdb2messages-20170924 лог когда увидел проблемму
messages-20170911 лог когда это произошло
sdb3 не входит в raid и похоже давно , посмотрите что на нем.
> sdb3 не входит в raid и похоже давно , посмотрите что на
> нем.md126 - sda2/sdb2 - /boot
md127 - sda3[sdb3] - /
^^^^^^^^^^^^^^^^^^^^^^- sdb3 отсутствует в рейде, причем давно.ps. Trim не настраивали?
>> sdb3 не входит в raid и похоже давно , посмотрите что на
>> нем.
> md126 - sda2/sdb2 - /boot
> md127 - sda3[sdb3] - /
> ^^^^^^^^^^^^^^^^^^^^^^- sdb3 отсутствует в рейде, причем давно.
> ps. Trim не настраивали?Там копия системы на начало сентября. Это и послужило той разницей в 20 дней. Trim не настраивал. Есть ли смысл вводить sdb3 в raid снова или лучше пересобрать новый массив? Что могло послужить выпадению раздела из raid?
>>> sdb3 не входит в raid и похоже давно , посмотрите что на
>>> нем.
>> md126 - sda2/sdb2 - /boot
>> md127 - sda3[sdb3] - /
>> ^^^^^^^^^^^^^^^^^^^^^^- sdb3 отсутствует в рейде, причем давно.
>> ps. Trim не настраивали?
> Там копия системы на начало сентября. Это и послужило той разницей в
> 20 дней. Trim не настраивал. Есть ли смысл вводить sdb3 в
> raid снова или лучше пересобрать новый массив?это как Вы считаете нужным:
/boot у Вас в raid1
/ - у Вас в raid1, но degradedНужно самому себе решить:
- использовать RAID1 или нет?И если уж использовать, то смысл разделять /boot и / ?
Это только в RH какие-то предрассудки...>Что могло послужить выпадению
> раздела из raid?не знаю, нужно было настроить mdmonitor с уведомлением
на почту для отслеживания состоянияps. Я бы настроил Trim и убрал из smartd SSD или докрутил бы
его под SSD, можно скачать утилиты с Intel для проверки SSD
и тоже мониторить
> И если уж использовать, то смысл разделять /boot и / ?
> Это только в RH какие-то предрассудки...ну не знаю, иногда бывает нужно разносить. Например могут понадобиться разные фс.
Помню сталкивался на CentOS 6 с проблемами не возможности монтирования/просмотра данных на ext4 из grub rescue console. А часто при восстановление рейда бывало нужно. Но тут дело скорее в версии grub, точно уже не помню. В итоге я всегда /boot выносил на ext3, а сами данные на xfs/ext4.
>> И если уж использовать, то смысл разделять /boot и / ?
>> Это только в RH какие-то предрассудки...
> ну не знаю, иногда бывает нужно разносить. Например могут понадобиться разные фс.
> Помню сталкивался на CentOS 6 с проблемами не возможности монтирования/просмотра данных
> на ext4 из grub rescue console. А часто при восстановление рейда
> бывало нужно. Но тут дело скорее в версии grub, точно уже
> не помню. В итоге я всегда /boot выносил на ext3, а
> сами данные на xfs/ext4.возможно, но сам не сталкивался