The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Файловая система Tux3 вероятно будет добавлена в ядро Linux"
Отправлено Аноним, 31-Мрт-14 19:31 
> Ась? что, по сети можно вольюмы объединять в файловые системы?

Это вообще уже не к дисковой ФС вопросы а к надстройкам над ними.

> или возможна загрузка с btrfs-raid5-тома?

На каком-то фундаментальном уровне не вижу чему это будет противоречить. Если бутлоадер может прочесть ядро и рамдиск, разумеется. Linux можно грузить вообще с любой похабщины, ему самому по себе все-равно и там возможностей по костылированию странных вещей в процессе загрузки - хоть отбавляй. Так что если кому сильно надо - имхо сделают. Может и с костылями, да. Вот только для начала, код RAID5/6 в ядре без году неделю и он был добавлен как нестабильный. Я бы им пока вообще не пользовался. Он сырой и грабельный. Хотя если хочется получть граблями по лбу и показательно демонстрировать шишку - вы по адресу. Особенно хорошо получится если взять ядро подревнее, без багфиксов в этом коде. В самых первых ядрах там журналирование с райдом работало некорректно. Так что вы берите ваши суперстабильные, LTSные, как раз получите термоядерный стабилизец с нефикшеным кодом райдов, если фиксы не портировали.

> от коллег (как, видимо автору этого заявления) что mdadm в принципе
> работает, но и собирать массивы, которые были развалены, в том числе
> под нагрузкой, ничего, норм собиралось,

Понятно. На уровне алгоритмов вы по нулям. Если данные на дисках разошлись, RAID не знает какая из копий правильная. Как минимум зеркало и raid5 - точно. Там нет чексумм в их нормальном понимании. Поэтому если диск не сдох совсем, а начал подвирать в выдаваемых данных - это само по себе обнаружено на уровне RAID не будет. А науке известны самые разные глюки, от "вернул не тот сектор" до "ошибка чтения проскочила через CRC/ECC как правильные данные" или "фирмваре сдурело и вернуло шум океанов марса".

> рассыпавшихся рэйдов на ошибки не натыкалась, что говорит о правильной сборке.

Ваше мямление говорит о том что вы не в курсе как это работает. FAIL.

> того в 5-м и 6-м рэйдах есть чексуммы, по которым-таки можно
> сказать какая группа блоков содержит актуальные данные,

А вы давно смотрели как тот же RAID5 сделан? Там вообще-то данные на дисках + избыточный XOR на n+1 по ширине блоке. Если какой-то диск совсем выпал, путем нехитрой математики восстанавливается что выпавший блок данных (с использованием XOR блока), что сам блок с XOR (с использованием блоков данныз). Вот только для этого надо знать что диск проблемный и игнорировать его, считая его данные отсутствующими. А если диск скажем подвирает в данных - тут уже возможны варианты. Логика работы RAID5 не предусматривает данный случай и полноценный рекавери из него. Даже если мы видим что N блоков != XOR, мы не знаем какой из дисков нам соврал. При этом есть несколько вариантов какими на самом деле были данные. Неверными может быть как каждый из блоков данных, так и XOR-блок. Нет никакого способа узнать какой из вариантов на самом деле был правильный. Если ФС подыграет, отдельно храня чексумму - можно опробовать все варианты и понять какой из них ведет к корректной чексумме. Но это требует хранения какой-то относительно компактной и надежной чексуммы где-то сбоку, это не про простые блочные RAID.

> кроме того восстановить недостающие/повреждённые блоки информации.

Недостающие - может. А вот с повреждениями - см. выше.

> А что касается снэпшотов - уважаемый, возьмите хорошо прогруженный БД-сервер

А это зачем? У БД обычно есть своя журнальная логика, сделанная под вполне конкретные допущения. Снапшотить сие - затея странная. А вы вообще понимаете что будет с базой после отката снапшота, для начала? База уже сказала клиентам в рамках транзакционной модели "вот это записано!". Пришел кулсисоп. Откатил снапшот. Записи испарились. Но клиенту то сказали что все записано. Хорошая идея. Был у меня миллион на счете. Я его снял. А тут база забывает что я транзакцию сделал. Очень удобно: у меня снова миллион на счете. Как вы думаете, сколько вам вазелина потребуется? :)

> А что касается сказочников из оракла - дооо, конечно работает!

Пока-что я детектировал тут другого сказочника, который снапшотит базы данных и восстанавливает во всех случаях данные глупными блочными RAIDами.

> данных на продакшне - это какбэ фигня, никто не заметит же,

Так сабж как раз об этом.

> особенно под хорошим грузом.

Кэп намекает что сабж как раз для того и затеян. И да, ваши репорты давностью в квартал с вашим стабилизцом имеют околонулевую ценность когда вопрос о WIP. Если с того момента вышло 3-4 новых ядра - результаты тестирования на мегастабильном ядре (с бажным кодом btrfs) - вообще ни о чем.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, [email protected] (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру