| 1.1, Аноним (1), 11:07, 25/03/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +2 +/– |
В одном из релизов подвезли использование оперативной памяти в дополнение к VRAM и это позволило мне запускать на 3090 qwen3.5-27b с 200k контекста на хорошей скорости 20t/s без всяких танцев с бубном.
| | |
| |
| 2.8, Аноним (8), 12:03, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
Извиняюсь за оффтоп, но что всё-таки лучше: gpt 20b или gwen 27b?
| | |
| |
| 3.12, geth (?), 12:11, 25/03/2026 [^] [^^] [^^^] [ответить]
| +2 +/– |
oss-20b совсем слабая. И 120b слабая. И облачная gpt-5.2 намного слабее чем qwen 3.5 тоже облачный. Из локальных моделей которые не требуют прям сотен ГБ ОЗУ и видео ценой в пол квартиры сейчас имеет смысл смотреть на 35B-A3B и 122B-A10B квантованные от какого нибудь unsloth.ai там и документация есть и сценарии как и что запускать.
Про oss забудьте, это прошлое поколение.
| | |
| |
| 4.14, Аноним (8), 12:38, 25/03/2026 [^] [^^] [^^^] [ответить]
| –1 +/– |
Какая модель лучше всего подходит под такую конфигурацию: 5070ti & 128Gb RAM?
| | |
| |
| 5.16, geth (?), 13:00, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
Зависит от того какую скорость генерации вы считаете приемлемой. Для некоторых задач как я показывал выше норма это 10 т.с. Это текст, можно спокойно подождать генерации и в моем случае распознавание голосов на совещаниях для создания краткого резюме о чем договорились, ну можно же и 10 минут подождать. Для генерации кода или разбора логов в рилтайме могут быть совсем другие требования по общей скорости генерации токенов, ширине контекста, скорости получения первого токена. Короче-пробуйте разное. На HF можно указать какое видео и проц и оно будет примерно показывать что норм влезет. На unsloth в разделе qwen 3.5 есть сводная таблица по весу моделей с разным количеством параметров и разным уровнем квантования. По сути ваша конфигурация очень хорошо будет гонять 35b с широким контекстом и намного хуже 122b но все это еще и зависит от требуемой точности. Чаще всего 16 и 8 битное квантование излишни, но в некоторых задачах это может быть важным.
| | |
|
|
|
| 2.9, geth (?), 12:04, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
1. llama.cpp и никаких танцев. Только скорость генерации падает.
2. На 5070 с 12Гб и ddr4 35B-A3B в 4х битном квантовании дает 40 т.с.
3. На 4090 с 24Гб 122B-A10B 4х битный дает свыше 10 т.с. вместе с openwebUI в чате с 256к контекста.
| | |
| 2.15, Аноним (15), 12:39, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
Можешь написать, что именно имеешь в виду? Название технологии или ссылку.
| | |
|
| |
| 2.4, Дмитрий (??), 11:28, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
И не говори... даже старые дрова, которые сами не осиливают поддерживать не открывают...
| | |
| |
| 3.19, Аноним (-), 13:44, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
Откуда-то у халявщиков святая уверенность, что если продукт перешёл в состояние legacy, он должен быть немедленно открыт.
| | |
| |
| |
| |
| 6.31, КО (?), 14:57, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
Ну да телефоны можно каждый день менят никто ничего не обязан, но почему-то кто-то решает как часто
| | |
|
|
|
| |
| 4.27, Аноним (27), 14:38, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– | |
> Берите B580 как у Линуса
А потом у тебя игры не запускаются, потому что на 0.2% интеловых видях просто положили болт. И уверен, что это только начало.
| | |
|
|
| 2.6, Аноним (6), 11:55, 25/03/2026 [^] [^^] [^^^] [ответить]
| +3 +/– |
А при том что твой open source работает на проприетарном железе.
Пишите так, как будто вы у себя в гараже аналог ASML сделали.
| | |
| 2.25, Аноним (-), 14:22, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– |
> Исходные тексты модулей ядра nvidia.ko, nvidia-drm.ko (Direct Rendering Manager),
> nvidia-modeset.ko и nvidia-uvm.ko (Unified Video Memory) из новой ветки NVIDIA, а также
> используемые в них общие компоненты, не привязанные к операционной системе, размещены на
> GitHub.
Вам что, мало?
Нужно было больше gpl_only символов пихать в ядро))
Тогда точно все опенсорным станет!
| | |
|
| 1.17, Аноним (17), 13:18, 25/03/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– | |
> минимально поддерживаемых версий заявлены Wayland 1.20 (2021 год), X.Org Server 1.17 (2015 год)
Почему по вейленду такая сильная зависимость?
| | |
| |
| 2.18, Аноним (33), 13:40, 25/03/2026 [^] [^^] [^^^] [ответить]
| +1 +/– |
Он устаревает в момент выхода новой версии. И заодно повышает требования к ядру таким образом, что все устаревшие ветки (лтс и тд) становятся неюзабельными. Бэкпортировать для вейланда считают не целесообразным.
| | |
| 2.26, Аноним (-), 14:29, 25/03/2026 [^] [^^] [^^^] [ответить]
| +/– | |
> Почему по вейленду такая сильная зависимость?
Сильная?
Але, 2026 год на дворе.
Это же не иксы, в которые за последние десять лет ничего полезного не добавили.
| | |
|
| 1.28, Аноним (28), 14:38, 25/03/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Я джва когда ждал. Они починили vsync в фулскрин окнах в иксах. В какой-то момент сломали и приходилось через gamescope большинство игр запускать.
| | |
| 1.29, Аноним (29), 14:51, 25/03/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Самое главное забыли: заявлено исправление композитинга в XFWM. Сломали в 580.105.08 и с тех пор XFWM нормально не работал.
| | |
|