1.1, 12yoexpert (ok), 00:45, 26/06/2025 [ответить]
| –1 +/– |
пожалуй, я попрошу в кафетерии, чтобы для них испекли торт с надписью "а оно того стоило?"
| |
1.2, Аноним (2), 01:29, 26/06/2025 [ответить]
| +/– |
Даже начинать не стоило . Это из числа функций где ии-модели абсолютно вне конкуренции .
| |
|
2.5, morphe (?), 03:16, 26/06/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
> Это из числа функций где ии-модели абсолютно вне конкуренции .
У whisper слишком много галлюцинаций, особенно у третьей версии: https://deepgram.com/learn/whisper-v3-results
Любая тишина/странный шум их официальным декодером определяется как "Like and subscribe" и прочим мусором что оно подцепило из обучающей выборки
Это всё можно обработать и обрезать перед кормлением, но там вскрывается куча других проблем, вроде того что whisper очень сложно заставить работать в режиме реального времени, ни одна из готовых реализаций не умеет нормальный батчинг, и т.д
Всё это делает whisper для многих задач хуже чем некоторые более алгоритмические модели
Решение? Обучать свой декодер, желательно на базе llama, а не как встроенный gpt2, переписывать whisper нормально для реализации нужных фич, либо вовсе перейти на коммерческие решения
То что coqui закрылся это плохо, потому что он вполне мог конкурировать с условным гугловым TTS в некоторых языках, и из коробки имел всё то о чём я выше написал как о минусах whisper.
| |
|
|
2.4, Аноним (4), 02:07, 26/06/2025 [^] [^^] [^^^] [ответить]
| –1 +/– |
Когда вместо допиливания FF на десетопы и мобилки они потратили все деньги и время на разные сторонние проекты. Уже не за горами время когда FF превратится в нескучный скин для chromium
| |
|
1.8, Аноним (8), 04:49, 26/06/2025 [ответить]
| +/– |
Эффективные менеджеры эффективно освоили/распилили средства. Проект успешно завершен. А что, кто-то думал, что будет как-то иначе?
| |
|