The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Релиз ядра Linux 6.8, opennews (??), 11-Мрт-24, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


62. "Релиз ядра Linux 6.8"  +1 +/
Сообщение от Аноним (-), 11-Мрт-24, 12:49 
> Intel® In-Memory Analytics Accelerator (Intel® IAA)
> Он вроде бы немножко (не факт что эффективно) умеет в Deflate, а
> вот всякое действительно нужное и востребованное что-то как-то и нет... zstd,
> lz4, brotly и прочего и не пахнет

А что ты в LZ4 собрался ускорять, чудак? Он в оперативу обычно упирается, иногда делая memcpy... :)

Ответить | Правка | Наверх | Cообщить модератору

81. "Релиз ядра Linux 6.8"  +/
Сообщение от Аноним (102), 11-Мрт-24, 13:31 
Оператива вполне может быть 4х канальная, во что ты там упираться собрался, чудак? Там, где используется lz4, и 8 канальная норма. Сейчас уже и 12 канальная вполне применяется.
Ответить | Правка | Наверх | Cообщить модератору

98. "Релиз ядра Linux 6.8"  –1 +/
Сообщение от cheburnator9000 (ok), 11-Мрт-24, 14:25 
4х канальная это когда на одном контроллере памяти от CPU сидят 4 DIMM слота под озу?
Ответить | Правка | Наверх | Cообщить модератору

100. "Релиз ядра Linux 6.8"  +/
Сообщение от Аноним (102), 11-Мрт-24, 14:34 
При этом они все работают параллельно, что фактически даёт N-кратный прирост производительности.
Ответить | Правка | Наверх | Cообщить модератору

138. "Релиз ядра Linux 6.8"  +1 +/
Сообщение от Аноним (-), 11-Мрт-24, 15:34 
> При этом они все работают параллельно, что фактически даёт N-кратный
> прирост производительности.

Далеко не всегда, кстати. Ибо latency и проч не отменяли. А если вы хотели именно большие блоки, последовательным доступом - может, вы GDDR какой так то хотели? А то и вовсе HBM какой. Тот вообще на 4096 бит шине висит, сколько это в терминах каналов - сами посчитайте. Но как вы уже поняли, профит с этого наступает только сильно местами. Latency разворота шины в другой адрес это ж не отменяет...


Ответить | Правка | Наверх | Cообщить модератору

214. "Релиз ядра Linux 6.8"  +/
Сообщение от cheburnator9000 (ok), 11-Мрт-24, 22:19 
На простых материнских платах десктоп и серверных доступ к озу идет по каналам самой материнки, там Latency по дефолту уже "высокий". Вон Apple припаивает чипы памяти прямо вплотную к процу, вот только хрен ты ее собственноручно апгрейдишь или заменишь :D

Гарантия от самого apple год, по подписке три года сверху за 100 долларов иными словами железо apple дизайнили чтобы оно твердо отработало четыре года, а там дальше уже как повезет, в идиальном мире от apple каждый клиент подсаживается на продукцию как на иглу и обновляется как только так сразу.

Ответить | Правка | Наверх | Cообщить модератору

228. "Релиз ядра Linux 6.8"  +/
Сообщение от Аноним (-), 11-Мрт-24, 23:55 
> На простых материнских платах десктоп и серверных доступ к озу идет по
> каналам самой материнки, там Latency по дефолту уже "высокий".

Тут вот какое дело: по шине сперва надо адрес передать. И это всегда подразумевает некую латенси на весь этот сетап операции. Никакой interleave не отменяет этот сетап. Хоть как.

А вот потом - если это последовательный блочный доступ - уже возможны оптимизации когда весь блок валится по шинам оптом без дополнительного сетапа, а потому заметно резвее. От этого выигрывают даже современные DDR'ы, но GDDR и HBM основательно затюнены под подобные сценарии - и это их все.

> Вон Apple припаивает чипы памяти прямо вплотную к процу, вот только хрен ты
> ее собственноручно апгрейдишь или заменишь :D

AMD на топовых видяхах вообще местами заменил печатку на кремниевый interposer и раскидал там шину аж на 4096 битов, к чипам HBM памяти на том же interposer'е. Такая высокоплотная "печатка". Шина толкающая аж 4096 битов за цикл - круто и дофига. На текстолите столько вообще раскинуть душно будет. В кремний же еще и не столько можно впихать с IC'шными процессами литографии. Но сетап рандомнго доступа это все же не отменяет и профит не такой крутой как могло бы хотеться, если это не линейные операции с большим блоком. А вот стоит - дохрена, увы. Удел hi-end решений.

> apple каждый клиент подсаживается на продукцию как на иглу и обновляется
> как только так сразу.

Ну вот что что а эпл обычно железки довольно качественно делает в целом. Они себя как премиум позиционируют и в откровенной экономии на спичках - не были замечены. Для меня они не годятся ибо вендорлокер повернутый на тоталконтроле. Мне не надо "богов" в моих системах. Даже симпотных.

Ответить | Правка | Наверх | Cообщить модератору

117. "Релиз ядра Linux 6.8"  +1 +/
Сообщение от Аноним (-), 11-Мрт-24, 15:17 
> Оператива вполне может быть 4х канальная, во что ты там упираться собрался, чудак?

Вот в нее. LZ4 - _очень_ быстрый в декодировани алго. Он mem-bound в общем случае. И бывает быстрее memcpy за счет снижения чтения из RAM и нагрузки на шинах.

> Там, где используется lz4, и 8 канальная норма. Сейчас уже
> и 12 канальная вполне применяется.

И чего? Типа, проц это не прогрузит чтоли? В LZ4 сложность декомпрессии сравнима с memcpy по сути.

Ответить | Правка | К родителю #81 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру