URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 122376
[ Назад ]

Исходное сообщение
"Компания Mozilla представила движок распознавания речи DeepSpeech 0.9"

Отправлено opennews , 09-Ноя-20 11:39 
Опубликован выпуск развиваемого компанией Mozilla движка распознавания речи DeepSpeech 0.9, реализующего одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu.  Реализация написана на языке Python с использованием платформы машинного обучения TensorFlow и распространяется под свободной лицензией MPL 2.0...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=54053


Содержание

Сообщения в этом обсуждении
"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 11:39 
Пусть в мобильный браузер хоть встроят, там и "помощник" есть.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:02 
> В предложенной модели наилучший результат распознавания достигается при чистой записи мужского голоса с американским акцентом в окружении без посторонних шумов.

Забыли добавить, что говорить должен белый гетеросексуальный мужчина. Если говорит нeгp, то количество ошибок удваивается, а если он еще и гoмoceк, то утраивается.

#whitelivesmatter


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Zenitur , 09-Ноя-20 11:45 
Фрунзик Мкртчян

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 08:53 
Очень нужное.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено nshmyrev , 09-Ноя-20 11:59 
Кстати, заметьте, что точность распознавания не измеряют и не публикуют. А дело в том, что точность упала, хуже, чем в версии 0.7:

version/set        0.7     0.9

tedlium           18.03    18.80
tedlium-tflite    19.58    21.15
librispeech       6.12     7.27


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 11:58 
Пусть лучше браузер здорового человека представят.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 12:10 
Это скучно и нехайпово.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 12:22 
Ну... Это аж целых шерстяного и тобика нанимать.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 12:44 
У них браузер некрозофила получается.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено rshadow , 09-Ноя-20 13:55 
В целом то они это для браузера и пилят. Уже чайники по команде закипать умеют. А браузер до сих пор любимый канал ютубчика открыть не может.
</sarcasm>

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:26 
> А браузер до сих пор любимый канал ютубчика открыть не может.

УМВР. ЧЯДНТ?


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено rshadow , 10-Ноя-20 12:56 
Работает голосовое управление в лисе? Или ты из тех которые в контекст беседы не умеют?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 12-Ноя-20 15:19 
При чем тут голосовое управление?!

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено arthi747 , 10-Ноя-20 23:20 
У мя фирефокс примерно минут через 15 на ютубе начинат тупить и потом видео совсем останавливается. При этом htop говорит что свободных ресурсов дофига. Чистить профиль и удалять дополнения не помогает. На том же железе хромые браузеры просто работают. Я понимаю что есть важные и неотложные дела типа инклюзивных названий но может сделают уже элементарные вещи?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Александр , 15-Ноя-20 21:58 
На всех компах и ноутах использую лису, ни разу с таким глюком не встречался. ЧЯДНТ?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:04 
Так сделано уже. Firefox называется.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:26 
Он скатился.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 11-Ноя-20 00:45 
Да. Был такой браузер.
И сейчас стоит. Но пользоваться не хочется. Как бы двусмысленно это не звучало.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 07:13 
Chrome (не Chromium)

/thread


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено lockywolf , 09-Ноя-20 11:59 
В CMU Sphinx контрибутить неее, это недостаточно NIH.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Голуб4ик , 09-Ноя-20 12:16 
В перспективе этим можно субтитры к youtube видео делать?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено rshadow , 09-Ноя-20 13:56 
В ютубе и так автоматические субтитры давно есть. И качество тоже не ахти.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено n00by , 09-Ноя-20 15:50 
Отличное качество. Клип "Денег мало, длинный шмель, ты в кибитку не ходи" не даст соврать.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено васьок , 10-Ноя-20 15:21 
Я регулярно лунтика смотрю - субтитры просто жэсть. В некоторых серияфх еще ничего - видно что человек помогал.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 12:17 
Звук не ждать.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 12:40 
Let me deep speak from my deep throat.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено YetAnotherOnanym , 09-Ноя-20 13:10 
Miss Lovelace, please, do log in.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Ordu , 09-Ноя-20 13:20 
Ok, just do not try to speak all of your deep mind, stick to a surface level.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:06 
Извращенцы! Забанить вас всех надо...

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Nicholas , 09-Ноя-20 12:49 
Когда они уже запилят переводчик в Firefox

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:28 
Зачем тащить его в браузер? Без этого пуля недостаточно серебряная?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено TrickyFoxy , 09-Ноя-20 18:20 
Попробуйте https://addons.mozilla.org/ru/firefox/addon/traduzir-paginas.../

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:03 
Кто-нибудь говорит с браузерами?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:08 
Будут.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:43 
это печально

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:15 
Изолировать надо от общества таких.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:53 
Уже сделано, ты общаешься сейчас через браузер, а не лично.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 18:20 
Думаешь, вот сейчас это тебе браузер написал?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Im banana man , 09-Ноя-20 15:00 
Инвалиды?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Anonim , 09-Ноя-20 16:16 
Tolko esli otkryt opennet.ru

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Урри , 09-Ноя-20 16:16 
Зачем? Браузеры и без этого вас спокойно слушают.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено InuYasha , 10-Ноя-20 14:57 
Так эффективность же! Так-то браузер должен довольно толстый звук отсылать, а с ДипСпичом - коротенькие текстики, которые в общем трафике даже не заметишь. )

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Kuromi , 09-Ноя-20 17:00 
Они сами слушать будут.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено YetAnotherOnanym , 09-Ноя-20 13:05 
> Реализация написана на языке Python
> Производительности достаточно для использования движка

А как это?
> Из недостатков DeepSpeech упоминается низкая производительность

Они бы там как-то определились бы...


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:11 
о, завсегдатай иксперт опеннета, ты tensorflow-то кроме как в строках новостей на опеннете видел? а почему рот весь в тупых комментариях?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено JustCurious , 09-Ноя-20 13:34 
Насколько я понял, низкая производительность - это именно про архитектуру нейронки DeepSpeech, а не про какие то проблемы в реализации их одноименного движка.

А насчёт Python - это врядли узкое место. TensorFlow написан на С++, а Python - это просто интерфейс. Кроме того, в TensorFlow вы сначала задаёте граф вычислений, а перед выполнением он "компилируется" для максимальной производительности, поэтому даже между операциями графа нет никакого оверхеда от Python.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено n00by , 09-Ноя-20 15:54 
Цитата без купюр:

низкая производительность и высокое потребление памяти
_в_ _декодировщике_, а также существенные ресурсы для обучения модели


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 09:20 
и к чему эта цитата?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено YetAnotherOnanym , 10-Ноя-20 09:23 
И? Вы берётесь утверждать, что "_декодировщик_" не является частью продукта, о котором идёт речь?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено n00by , 10-Ноя-20 14:32 
Увы, Вы не угадали, не берусь. Берусь утверждать, что название является частью продукта.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:08 
А браузер они не пробовали представить?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Kuromi , 09-Ноя-20 22:41 
> А браузер они не пробовали представить?

Они пробовали. Но там сейчас проблемка - они с помпой пообещали WebRender и аппаратное ускорение на всех платформах, а теперь выяснилось что это больно занудно делать и пошел тихий откат к софтверному-всему.


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 13:24 
We need to go deeper

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено istepan , 09-Ноя-20 13:50 
В Common Voice мало текста для русского, но можно дополнять.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 14:41 
Лучше бы вернули назад просто хороший браузер. А не это фиолетовое смузи, которое кроят всё последнее время.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 14:46 
Некогда им браузер делать, они смузихлёбные языки разрабатывают.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 10:00 
Лижут гуглу. Кой-чего.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 15:05 
Мне нравится новая тема оформления (Firefox Alpenglow). Я так считаю, это главное достижение Мозиллы за последние 15 лет.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 01:09 
> за последние 15 лет

Когда-то между Спутником и Гагариным понадобилось всего 4 года. Сейчас 15 лет пилят тему...


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Im banana man , 09-Ноя-20 14:59 
Компания оправдывает свое название на все 100% )

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено NotaBug , 09-Ноя-20 15:51 
Мля, ещё один зонд. Как же достало при каждом обновлении перелопачивать about:config, так они ещё и шифруются, постоянно меняя названия переменных.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено rvs2016 , 09-Ноя-20 15:53 
Подождём, когда в этом движке наваяют распознавателя русской речи без бубна.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено anonymous , 09-Ноя-20 19:39 
А можно тупо надрать голоса с ютуб-ролков? Или там какие-то проблемы с легальностью?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Lex , 09-Ноя-20 20:18 
Там не только голос нужен, но и текст, который этот «голос» говорит

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено anonymous , 09-Ноя-20 21:17 
Ну текст записать не проблема.

Вот голос взять откуда-нибудь - это беда. Это хрому хорошо, его пользователи рады вставлять себе зонды, и можно тупо собрать их голоса. А вот пользователи мозиллы шифруются и отдавать голоса не станут.


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Lex , 09-Ноя-20 23:17 
Чего «не проблема» ?
-Перед скармливанием каждого ютубовского ролика внимательно его прослушивать и делать норм расшифровку аудио.. )

Тогда уж проще написать скрипт, который бы парсил сайты с текстами песен, искал бы по авторам и названиям сами аудиозаписи и эти пары скармливал системе( тогда и голосов много разных будет и шумов. Авось распознавать лучше станет ).

Но есть смутное подозрение, что каждое слово должно быть привязано к конкретному моменту времени в треке, что уже едва ли просто автоматизировать( а вручную - ппц как муторно расставлять )


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 00:00 
> скрипт, который бы парсил скрипт, который бы парсил сайты с текстами песен, искал бы по авторам и названиям сами аудиозаписи и эти пары скармливал системе

Правда, тогда для правильного распознавания текст петь нужно будет ;)


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Lex , 10-Ноя-20 12:52 
> Правда, тогда для правильного распознавания текст петь нужно будет ;)

Где-то петь, где-то - по барабанам стучать. Так, пожалуй, даже веселее будет :)


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено 1 , 10-Ноя-20 17:22 
аудиокнижек накачать и оригиналы тут же ?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 19:42 
Полезная вещь. Если прикрутить к браузеру, то тот сможет в дополнительной телеметрии передавать все, что он о себе услышал.  :)

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 19:52 
На python будет тормозить

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 09:21 
ты будешь тормозить

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 20:54 
Лучше бы нормальную tts с качественными голосами написали, а то кроме убогого фестиваля больше ничего нет.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено ПэЖэ , 09-Ноя-20 21:03 
>Лучше бы нормальную tts с качественными голосами написали, а то кроме убогого фестиваля больше ничего нет.

про RHVoice не слышал что ли?


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 21:43 
RHVoice качественным можно только назвать по сравнению с фестивалем.

У Мозилы есть свой достаточно технологичный TTS проект, но до практического применения там, боюсь, еще далеко:
https://github.com/mozilla/TTS


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 21:45 
>про RHVoice не слышал что ли?

Я про него забыл. Он конечно намного лучше фестиваля, но всё равно сильно режет слух.


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 09-Ноя-20 21:18 
Firefox Browser 82.0.3
Вышел.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 01:45 
Русские модели не найдутся? Интересная вещь

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним12345 , 10-Ноя-20 07:59 
Про русский как всегда забыли

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 09:09 
Не забыли.

> Для других языков можно обучить систему самостоятельно по прилагаемой инструкции, используя голосовые данные, собранные проектом Common Voice.

Просто лично ты систему не обучил.


"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 14:44 
Вам какой русский, Шнурова или Джигурды?

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Брат Анон , 10-Ноя-20 09:37 
Я правильно понимаю, что запилить распознователь речи -- это теперь интереснее, чем доделать хруст?))
--
Если серьёзно, то это скакание с темы на тему очень похоже на один психиатрический диагноз, который не сулит мазилке ничего хорошего. Хоть что-то бы доделали до конца.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 09:55 
Файрфокс своё уже отколбасил. Всё.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Ingener , 10-Ноя-20 15:51 
Ну движок и движок. Представила компания Мозалла и представила. Мне пофиг. Мне не нужно. Мне некуда его заюзать. На в raspberry 3, ни в raspberry 4. Ни в LeTomato. Ну обновили и окей.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 18:09 
ска, 2020 объявлен годом префикса Deep. Кол-во DeepThorat запросов в гугле увеличилось вдвое.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Аноним , 10-Ноя-20 18:10 
*DeepThroat, очепятка.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено Ordu , 10-Ноя-20 18:20 
Мне кажется, ты отстаёшь от трендов. Deep суётся во все IT-щели уже лет пять как.

"Компания Mozilla представила движок распознавания речи DeepS..."
Отправлено АнонимусШифропанк , 10-Ноя-20 19:17 
Есть примеры, как это подружить с чем-нибудь вроде openHub?