URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 111777
[ Назад ]

Исходное сообщение
"Mozilla развивает свою систему распознавания речи"

Отправлено opennews , 21-Июл-17 10:42 
В рамках проекта по развитию собственной открытой системы распознавания речи компания Mozilla ввела в строй сервис Common Voice (https://voice.mozilla.org/), нацеленный на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или поучаствовать в оценке качества данных, добавленных другими пользователями.


Целью инициативы является накопление 10 тысяч часов c записями различного произнесения типовых фраз человеческой речи. На основе полученных данных будет сформирована открытая и бесплатная база данных, которую без ограничений можно будет использовать в системах машинного обучения и в исследовательских проектах. В настоящее время исследователям и разработчикам доступны только ограниченные наборы, а стоимость полноценных коллекций голосовых выборок исчисляется десятками тысяч долларов, что сильно тормозит независимые исследования в области распознавание речи.

Сервис запущен как часть более глобального проекта (https://research.mozilla.org/machine-learning/), в рамках которого планируется выпустить полностью свободную систему распознавания речи, которая использует современные методы машинного обучения. В отличие от уже имеющихся решений проект Mozilla подразумевает построение и открытие качественной модели для систем машинного обучения, а также реализацию расширенных алгоритмов для более точного выделения речи при наличии постороннего шума. В основе проекта Mozilla лежит движок
DeepSpeech (https://github.com/mozilla/DeepSpeech), реализованный с использованием открытой компанией Google платформы машинного обучения TensorFlow (https://www.opennet.me/opennews/art.shtml?num=46058). DeepSpeech реализует в коде одноимённую архитектуру распознавания речи, предложенную (https://arxiv.org/abs/1412.5567) исследователями из компании Baidu.

Система DeepSpeech значительно проще традиционных систем и при этом обеспечивает более высокое качество распознавания при наличии постороннего шума. Из достоинств также отмечается отсутствие необходимости подключения отдельных компонентов для моделирования различных отклонений, таких как шум, эхо и особенности  речи (наличие акцента и дефектов). DeepSpeech не использует традиционные акустические модели и концепцию фонем, вместо которых предлагается использовать хорошо оптимизированную систему машинного обучения на основе нейронной сети.
По уровню ошибок  DeepSpeech демонстрирует заметно лучшие результаты, по сравнению с коммерческими системами Google Speech, Bing Speech и Apple Dictatio.

Для использования распознавания речи в online-приложениях и на мобильных устройствах Mozilla  разрабатывает систему Pipsqueak (https://github.com/mozilla/pipsqueak), представляющую собой серверное решение на основе архитектуры DeepSpeech. Для взаимодействия с движком планируется использовать Web Speech API (https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API). При этом движок будет достаточно легковесным и способным  работать даже на портативных системах, таких как  Raspberry Pi 3.

URL: https://news.ycombinator.com/item?id=14794654
Новость: http://www.opennet.me/opennews/art.shtml?num=46892


Содержание

Сообщения в этом обсуждении
"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 10:42 
Вот системы распознавания речи мозилле и не хватало. Теперь заживем.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 10:47 
Если мозилла оставит браузер в покое, или даже вернёт как было, и займётся распознаванием речи, то это будет прекрасно

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 11:33 
Аноним не знает, что распознавание речи - это часть современного бровайзера? https://dvcs.w3.org/hg/speech-api/raw-file/tip/speechapi.html

"Mozilla развивает свою систему распознавания речи"
Отправлено Crazy Alex , 21-Июл-17 14:02 
Так половина этих стандартов - адовая чушь, и что с того?

"Mozilla развивает свою систему распознавания речи"
Отправлено Михрютка , 21-Июл-17 21:57 
"It is not a W3C Standard nor is it on the W3C Standards Track."

аноним не умеет в понимать написанное?


"Mozilla развивает свою систему распознавания речи"
Отправлено username , 23-Июл-17 09:19 
только гуглоподелок, в сафари нет никаких иконок с микрофоном.
как страдаю даже не передать словами.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 13:50 
Походу, поздно уже.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 17:46 
На наш рынок идти с таким названием распознования речи - грех)

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 10:57 
Лишь бы браузером не заниматься (с) opennet-user

"Mozilla развивает свою систему распознавания речи"
Отправлено rshadow , 21-Июл-17 11:52 
У мозиллы много хороших проектов. Особенно те которые в которых минимум маркетинга, а больше дела.

"Mozilla развивает свою систему распознавания речи"
Отправлено Sluggard , 22-Июл-17 00:43 
Например, не считая Rust?
От Громоптички они отказались, Огнелис скатили в гoвнo, ОС свою выкинули на помойку...

"Mozilla развивает свою систему распознавания речи"
Отправлено mumu , 22-Июл-17 02:22 
Синхронизация вроде там вполне годно работает. И можно ставить на свой сервер, в отличии от прочих.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 03:27 
Но в новых версиях лисы сменить URL совсем не просто и не дружественно.

"Mozilla развивает свою систему распознавания речи"
Отправлено Sluggard , 22-Июл-17 11:42 
И всё это с криками «Банкай!» и «Гетсуга теншо!»? =)

"Mozilla развивает свою систему распознавания речи"
Отправлено Коробов , 21-Июл-17 13:07 
А потом в ведро выкинут. Норм, чё.

"Mozilla развивает свою систему распознавания речи"
Отправлено iPony , 21-Июл-17 11:05 
Тут всякие линуксоиды будут бугуртить как всегда о не нужности.
Но на самом деле это круто, и в этом будущее.
Рекомендую потыкать палочкой https://mycroft.ai - можно поставить на ту же Raspberry Pi

PS: а особо продвинутые могут предзаказать Марка Первого https://mycroft-ai.backerkit.com/hosted_preorders/83518 - будет помогать по дому


"Mozilla развивает свою систему распознавания речи"
Отправлено Zoolander , 21-Июл-17 11:30 
По-русски понимает?

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 20:24 
> По-русски понимает?

А зачем? Сидеть и командовать (голосом) - удел белых господ. Их язык, собственно, и записывают.


"Mozilla развивает свою систему распознавания речи"
Отправлено RobotsCantPoop , 21-Июл-17 23:40 
Ждём систему распознавания негров от Mozilla?

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 11:53 
Mycroft мошенники, когда они кроудфандинг проводили весь их искусственный интеллект распознавания речи сводился к обращению к Google API из Python скрипта.

Спустя два года ситуация не сильно изменилась https://github.com/MycroftAI/adapt та же Python обвязка с кучей регекспов для разбора фраз в лоб. Никаким AI там и не пахнет.

https://github.com/MycroftAI/mycroft-core/tree/dev/mycroft/stt


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 12:04 
Для тех кто не понял: Стоит у вас на тумбочке такой MycroftAI и всё что вы говорите в шлёт вначале на сервер api.mycroft.ai, а потом ещё отправляет в Google Voice для перевода в текст. Джордж Оруэлл о таком и не предполагал, что леминги сами будут телекраны себе ставить и с собой носить.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 03:32 
Кусок питона который выполняет роль прокси к гуглу. Поняши одобряют. Организаторы лоханувшие фаундеров тоже не в накладе.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 12:33 
Ненужности этого для браузера не отменяет.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 11:14 
Если они сделают, что-то получше, чем в остальных, то удачи им. А если это очередной велосипед, который закроют через полгода, то нинужна.

"Mozilla развивает свою систему распознавания речи"
Отправлено Pinkie , 21-Июл-17 11:30 
Они что, занимаются чем угодно, лишь бы браузер не пилить?

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 11:32 
И это прекрасно!

"Mozilla развивает свою систему распознавания речи"
Отправлено Pinkie , 21-Июл-17 11:35 
Было бы. Если бы браузер не трогали. А то "мы сделаем круглые вкладки, а потом сделаем квадратные, мы сделаем меню плитками а потом сделаем меню списком". Прямо как депутаты с зимним временем играются.

"Mozilla развивает свою систему распознавания речи"
Отправлено A.Stahl , 21-Июл-17 11:48 
О да -- форма закладок это что-то неимоверно важное. Как вообще можно пользоваться квадратными вкладками, да? 100 программистов 100 дней и 100 ночей меняют 100 вкладок. Ты действительно думаешь, что развитие браузера и форма вкладок как-то пересекаются? Рекомендую тебе 100 дней воздерживаться от наркотиков.

"Mozilla развивает свою систему распознавания речи"
Отправлено Crazy Alex , 21-Июл-17 14:03 
Есть такое понятие - "пример".

"Mozilla развивает свою систему распознавания речи"
Отправлено Sw00p aka Jerom , 21-Июл-17 15:54 
есть ещё понятие "контр-примера" )

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 21:57 
Стахл, тебе стоит воспользоваться собственной рекомендацией, ибо твой ответ нельзя назвать ни конструктивным, ни адекватным.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 11:31 
Мозилла поможет корпорации бабла с записями проклятий юзеров.

"Mozilla развивает свою систему распознавания речи"
Отправлено Дарья , 21-Июл-17 12:32 
Каждый год читаю как тот или иной опенсорсный проект развивает свою систему распознавания речи - а воз и ныне там. Пробовал почти все, из последнего какой-то KDE'шный проект, ни один ничего не распознает. Им бы объединиться и создать действительно что-то дельное, но нет.

"Mozilla развивает свою систему распознавания речи"
Отправлено A.Stahl , 21-Июл-17 12:39 
>Им бы объединиться

А если объединить ГАЗ и Cеверо-Заливский Теплоходный электро-механический завод, то они смогут выпускать космические ракеты? Нет? А почему?


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 20:22 
>Нет? А почему?

В первую очередь потому, что ты, вместо того, чтобы проект звездолёта разрабатывать, сидишь и питросянские комменты в промышленных объёмах производишь,


"Mozilla развивает свою систему распознавания речи"
Отправлено A.Stahl , 21-Июл-17 20:38 
Ну нихрена себе! Оказывается это я во всём виноват? Это из-за меня Россиюшка в такой жопочке? Не Путин, не правительство, не человекоящеры даже. А я. Вот оно как.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 23:38 
Наконец-то ты это понял. Новую жизнь, как обычно, с понедельника начнёшь?

"Mozilla развивает свою систему распознавания речи"
Отправлено iPony , 21-Июл-17 13:12 
> ни один ничего не распознает

Я тут вот сири решил попробовать. Обрадовался, что не нужно будет копытами махать. ВОт оно - будущее.
Но как громко не орал в микрофон - все равно пишет "Siri вас не слышит". Открыл настройки микрофона, выставил на максимальное все. Уровень показывает, что звук регистрируется микрофоном. Но все равно - Siri не слышит.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 13:14 
Под "не слышит" вполне может быть "не понимает, считает за уличный шум". Попробуй не орать.

"Mozilla развивает свою систему распознавания речи"
Отправлено A.Stahl , 21-Июл-17 13:42 
Анализатор рассчитан на человеческую речь, а не на и-го-го. Так что ничего не выйдет.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 02:41 
Ну не знаю... Я в микрофон гимн России пропукал, распознался.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 13:56 
Я надеюсь, ты на Ондроеде свою китайскую Сири открывал?

"Mozilla развивает свою систему распознавания речи"
Отправлено iPony , 21-Июл-17 14:17 
На макбуке... А в интернетах всё про айфоны пишут.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 22:04 
> На макбуке... А в интернетах всё про айфоны пишут.

На айфоне нормально слышит, но понимает плохо, а ответы сводятся к "Вот что я нашла в интернетах". Короче уши есть - осталось мозг дописать.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 15:24 
Может, от того, что он опенсорсный? Вот в навигаторе адрес распознает с вероятностью 999 из 1000

"Mozilla развивает свою систему распознавания речи"
Отправлено Zoolander , 21-Июл-17 18:10 
Сири, как и автопилоты в авто поумнеют лет через 15. Не раньше.

"Mozilla развивает свою систему распознавания речи"
Отправлено Led , 21-Июл-17 22:39 
Автопилоты в авто уже умнее 99% "водителей".

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 23-Июл-17 08:12 
Это они просто так ловко притворяются, моргая поворотами при поворотах.

"Mozilla развивает свою систему распознавания речи"
Отправлено Дуплик , 21-Июл-17 18:12 
Лучше бы Firefox под Wayland допилили. Стыд и срам, на дворе 21 век, а их браузер всё ещё зависит от X.Org

"Mozilla развивает свою систему распознавания речи"
Отправлено soarin , 21-Июл-17 18:18 
> Лучше бы Firefox под Wayland допилили.

Ну так если, wayland используют этак 0.01% их аудитории. То такой и приоритет.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 18:29 
Не так. 0.01% аудитории от 1.5% всей аудитории браузера.



"Mozilla развивает свою систему распознавания речи"
Отправлено soarin , 21-Июл-17 20:15 
ну так и это будет практически 0.01%

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 05:45 
> браузер всё ещё зависит от X.Org

На Windows уже завезли X.Org? Или все-же не зависит?


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 17:02 
Вот ждём. С нетерпением. Хоть так приобщимся к Богоподобному.



"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 21:50 
Когда они уже браузер сделают нормальный? Или, по всей видимости, уже никогда?

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 22:06 
> Когда они уже браузер сделают нормальный? Или, по всей видимости, уже никогда?

Уже делали, не помогло.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 22:12 
Еще и распозновалка речи? Когда там их гугл лишит бабла совсем,, задрали дурью маяться.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 23:21 
Еще немного и я таки пойду откапывать движок presto.

"Mozilla развивает свою систему распознавания речи"
Отправлено Led , 21-Июл-17 23:23 
> Еще немного и я таки пойду откапывать движок presto.

Не забудь и presto-интернет откопать, землекоп.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 21-Июл-17 23:31 
Так интернет разве не в земле? Да и он не так уж и устарел, presto то. Всяко проще его было бы допилить, чем servo сделать. Но придется изгибаться в стиле reactos. Или как сейчас распространяют патчи. Просто Mozilla точно то скоро перейдет на blink (webkit).

"Mozilla развивает свою систему распознавания речи"
Отправлено iPony , 22-Июл-17 07:27 
> Да и он не так уж и устарел, presto то. Всяко проще его было бы допилить, чем servo сделать.

Только с дивана так может показаться.


"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 11:44 
Всяко лучше мусорки современных движков. Закрыли скорее по другим не техническим мотивам.

"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 17:08 
Да, помню как веб-девелоперы "любили" presto в его живую бытность. А пользователи той Оперы были сильно похожи на линуксоидов, их было мало и они были злобными. И верещали аналогично: на этом сайте фрейм на фрейм наезжает, формочки не работают - плёхой сайт, не буду на него ходить. А этот вообще не открывается - ну, значит мне он нинужен(c)



"Mozilla развивает свою систему распознавания речи"
Отправлено Аноним , 22-Июл-17 22:05 
Так надо писать согласно веб-стандартам.