The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Для Linux предложена файловая система Composefs, opennews (??), 28-Ноя-22, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


1. "Для Linux предложена файловая система Composefs"  +1 +/
Сообщение от Аноним (-), 28-Ноя-22, 23:06 
> первичным идентификатором является не имя файла,
> а хэш от содержимого файла.

Так то идея хорошая, но если скажем в файле 80% блоков как у соседа, блочная дедупликация их уберет, а вон то разумеется в пролете, файло должно точно совпадать.

Ответить | Правка | Наверх | Cообщить модератору

128. "Для Linux предложена файловая система Composefs"  +/
Сообщение от Брат Анон (ok), 30-Ноя-22, 16:21 
Ты понимаешь как работает хэш? Например, SHA-256?
Ответить | Правка | Наверх | Cообщить модератору

145. "Для Linux предложена файловая система Composefs"  +/
Сообщение от Аноним (-), 01-Дек-22, 18:17 
> Ты понимаешь как работает хэш? Например, SHA-256?

Да. Можно делать независимый хэш на каждый блок ФС. При обнаружении совпадения с другим заменять на реф. Чем дедубликаторы и занимаются в ФС которые умеют в cow. Отсюда жор памяти онлайн дедупом: для скорости записи список хешей известных блоков должен быть в RAM. Офлайн дедубликаторы могут позволить себе хранить это в скоростной БД, .

Когда у файла 80% блоков совпадает, эти блоки БУДУТ заменены на референсы. Это прекрасно работает с образами виртуалок из 1 шаблона, разными версиями данных с общим предком и проч. А если в имени файла закодирован весь хэш всего файла - глобальный sha файлов все же разный, вон то уже не сработает. Будет 2 полностью разных файла.

Ответить | Правка | Наверх | Cообщить модератору

168. "Для Linux предложена файловая система Composefs"  +1 +/
Сообщение от Брат Анон (ok), 05-Дек-22, 13:37 
> Когда у файла 80% блоков совпадает, эти блоки БУДУТ заменены на референсы.
> Это прекрасно работает с образами виртуалок из 1 шаблона, разными версиями
> данных с общим предком и проч. А если в имени файла
> закодирован весь хэш всего файла - глобальный sha файлов все же
> разный, вон то уже не сработает. Будет 2 полностью разных файла.

Читай внимательно: хэш считается у блоков. Если меняется какая-то часть -- только это блок будет посчитан заново и ссылка будет заменена новым хэшем. Все остальные блоки (и хэши) останутся прежними). Если 80% блоков общие -- откуда жор памяти? А таблица страниц памяти -- жор в памяти не устраивает?

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру