Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум Разговоры, обсуждение новостей | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Google выпустил открытую AI-модель Gemma 4, построенную на технологиях Gemini 3 " | +/– | |
| Сообщение от opennews (??), 02-Апр-26, 23:44 | ||
Компания Google опубликовала новое семейство больших языковых моделей Gemma 4, основанных на технологиях модели Gemini 3. Gemma 4 распространяется под лицензией Apache в вариантах с 2.3, 4.5, 25.2 и 30.7 миллиардами параметров (E2B, E4B, 31B и 26B A4B). Варианты E2B и E4B подходят для использования на мобильных устройствах, системах интернета вещей (IoT) и платах типа Raspberry Pi, а остальные варианты пригодны для применения на рабочих станциях и системах с потребительскими GPU. Размер учитываемого моделью контекста составляет 128 тысяч токенов для моделей E2B и E4B, и 256 тысяч токенов для моделей 31B и 26B A4B... | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по ответам | RSS] |
| 1. Сообщение от Аноним (1), 02-Апр-26, 23:44 | +/– | |
Поздно. Qwen уже не догнать. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #5, #16 | ||
| 3. Сообщение от Аноним (3), 02-Апр-26, 23:51 | +3 +/– | |
Хех, какое же оно открытое, если это чёрный ящик? Просто freeware | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #7, #10, #24 | ||
| 4. Сообщение от Anonimbus (?), 02-Апр-26, 23:52 | +/– | |
Попробовал 26B A4B, не прошла большую часть моего тестового набора и оказалась хуже Qwen3.5 35B A3B и Devstral Small 2 24B instruct 2512. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #9 | ||
| 5. Сообщение от Аноним (5), 03-Апр-26, 00:12 | +2 +/– | |
Так она же болтается ни туда ни сюда по разным параметрам, а создатель модели и его команда ушли. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 Ответы: #14 | ||
| 6. Сообщение от Аноним (6), 03-Апр-26, 00:13 | –2 +/– | |
Перепись мажоров с бесполезной игрушкой в комментах. Инферрить дорого, а результат вообще ни на что не годен (это я сужу по сервисам, доступным в инете, такие же и более толстые модели хостящие, даже полноценный Gemini после отупления в начале 2024 если не ошибаюсь ни на что стал не годен, цензуру вкорячили - и модель отупела, ещё был весьма годен Grok для преобразования вкоряченных в контекст текстов, но на lmarena на него были очень конские лимиты, и o3 для написания принципиально нового кода с нуля через 0-shot промпты, он как раз офигенно работал, и сделал мне несколько наукоёмких вещей, которых я сам бы не сделал, не смотря на то, что моя подготовка позволяет, я на отладку подобной задачи (branch and bound + a*) месяц угрохал, а тут бац - и zero-shot промптом сразу результат, если бы результат не выдало - вот ту задачу, что я модели делегировал - я бы просто забросил, код кстати я выкинул, мне просто один раз надо было на вопросик ответить, чисто из любопытства, но не "сэмом альтманом клянусь", а с пруфами). Меня из моделей семейств gemma разве что 240m может заинтересовать - она идёт на моей "коре дуба" с 2 гигами DDR2-памяти. Но она тоже ни на что не годна. Она даже инструкции выполнить не может. Как и модели семейства LFM2.5 (они намного получше геммы, при том же объёме, но у них RNN + Neural ODE технология, они тормознутее, и со сбросом контекста в llama.cpp проблемы). | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #22, #23 | ||
| 7. Сообщение от Аноним (5), 03-Апр-26, 00:14 | +/– | |
>Gemma 4 распространяется под лицензией Apache | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 | ||
| 8. Сообщение от vibecoder (?), 03-Апр-26, 00:19 Скрыто ботом-модератором | +3 +/– | |
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 9. Сообщение от vibecoder (?), 03-Апр-26, 00:23 | +2 +/– | |
Devstral недооцененная моделька. В своё время очень удивила. Правда не знаю, как щас... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #18 | ||
| 10. Сообщение от vibecoder (?), 03-Апр-26, 00:26 | +1 +/– | |
Вы правы отчасти. По конструкции - да, черный ящик. Но это не freeware, это просто веса, которые... opensource. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 Ответы: #13 | ||
| 11. Сообщение от Аноним (11), 03-Апр-26, 00:35 | +/– | |
Candle тоже поддерживается https://github.com/huggingface/candle/pull/3443 | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 12. Сообщение от 12yoexpert (ok), 03-Апр-26, 00:37 | –2 +/– | |
домохозяйки ин да хаус, не скрыться от них | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 13. Сообщение от 12yoexpert (ok), 03-Апр-26, 00:40 | –1 +/– | |
cat /dev/random > веса | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #10 | ||
| 14. Сообщение от Аноним (1), 03-Апр-26, 00:44 | –1 +/– | |
> Так она же болтается ни туда ни сюда по разным параметрам | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 Ответы: #15 | ||
| 15. Сообщение от Аноним (5), 03-Апр-26, 00:47 | +/– | |
>Да и черт с ними, модели как выходят, так и выходят. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #14 Ответы: #17 | ||
| 16. Сообщение от Джон Титор (ok), 03-Апр-26, 00:49 Скрыто ботом-модератором | +/– | |
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 | ||
| 17. Сообщение от Аноним (1), 03-Апр-26, 01:07 | –1 +/– | |
https://en.wikipedia.org/wiki/Alibaba_Group | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 Ответы: #20 | ||
| 18. Сообщение от Аноним (5), 03-Апр-26, 01:09 | +/– | |
Потом вышла Devstral 2: | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #9 Ответы: #19 | ||
| 19. Сообщение от Аноним (5), 03-Апр-26, 01:16 | +/– | |
и Leanstral: | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #18 | ||
| 20. Сообщение от Аноним (5), 03-Апр-26, 01:17 | +/– | |
Ну вам виднее. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #17 Ответы: #21 | ||
| 21. Сообщение от Аноним (1), 03-Апр-26, 01:30 | +/– | |
Виднее любому, кто вышел из школьного возраста и перестал верить в байки про незаменимых людей. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #20 | ||
| 22. Сообщение от Джон Титор (ok), 03-Апр-26, 01:32 Скрыто ботом-модератором | +/– | |
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #6 | ||
| 23. Сообщение от Аноним (24), 03-Апр-26, 01:47 | +/– | |
"Мажор" это тот кто может взять 3090 с авито за 50к? Скорее перепись нищих, кто не может платить за аренду карт или API. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #6 | ||
| 24. Сообщение от Аноним (24), 03-Апр-26, 01:52 | +/– | |
Почему черный ящик? Просто берешь свой кластер из десятков тысяч B200 или других TPU, потом берешь сотни ТБ обучающей выборки собранную роботом гугла за все годы, вместо с google books, после этого дистиллируешь данную модель и вуаля, файнютнишь, получаешь гемму. Это прекрасно описано в статьях, осталось взять и сделать! | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 Ответы: #26 | ||
| 25. Сообщение от Аноним (25), 03-Апр-26, 01:59 | –1 +/– | |
Я не понял, а зачем такие крошечные модели (2B и 4B) делать мультимодальными? Хватило бы просто генерации текста. На 2-4B они и с текстом даже справляются с трудом - а тут ещё запихнули и звук и изображения. Нонсенс, всё тупо размажется по весам (а они не резиновые). Лучше бы ограничились текстом, но зато с более качественным результатом. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #27, #28 | ||
| 26. Сообщение от 12yoexpert (ok), 03-Апр-26, 02:05 | +/– | |
то есть гуманитарии теперь не только называют виртуалки bare metal-ом, джаву - нативной, а войну - водянкой, но и микрухи - полиуретаном | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #24 | ||
| 27. Сообщение от Аноним (27), 03-Апр-26, 02:20 | +/– | |
Чтоб можно было завести на телефоне или ноуте. Не для сложных логических задач, а для распознавания картинок, голоса, текстовой коммуникации. 4B вполне достойно на русском пишет. Лучше конкурентов на 8-9B. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #25 | ||
| 28. Сообщение от vibecoder (?), 03-Апр-26, 02:22 | +/– | |
Распознавать объекты или читать текст через камеру без интернета и без задержек... отсортировать 100500 скриншотов, считать QR-коды, навигация роботов-пылесосов, контроль качества на конвейере или помощь слабовидящим... да тысячи применений. С качественным энкодером (как CLIP) справляются с простым описанием изображений на ура. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #25 | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
|
Закладки на сайте Проследить за страницей |
Created 1996-2026 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |