The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Проект Mozilla выпустил открытую систему распознавания речи"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от opennews (?), 29-Ноя-17, 20:46 
Проект Mozilla опубликовал (https://blog.mozilla.org/blog/2017/11/29/announcing-the-init.../) первый выпуск модели (https://hacks.mozilla.org/2017/11/a-journey-to-10-word-error.../) для системы машинного обучения, ориентированной на распознавание речи. Также опубликован использованный для  тренировки модели набор (https://medium.com/mozilla-open-innovation/sharing-our-commo...) голосовых данных, собранный в результате инициативы Common Voice (https://voice.mozilla.org/) и включающий (https://voice.mozilla.org/data) примеры произношения около 20 тысяч людей, которые надиктовали почти 400 тысяч записей суммарной продолжительностью 500 часов.

Благодаря участию в проекте большого числа добровольцев, удалось сформировать одну из крупнейших баз голосовых шаблонов, учитывающих всё разнообразие голосов и манер речи. Собранная база позволила натренировать модель для системы машинного обучения до уровня распознавания речи, при котором число ошибок примерно соответствует распознаванию обычным человеком при прослушивании тех же записей. В текущем виде число ошибок распознавания составляет 6.5% при использовании тестового набора LibriSpeech (http://www.openslr.org/12/). Для сравнения,  уровень ошибок при распознавании человеком оценивается в 5.83%, а уровень ошибок при работе Google Speech составляет 6.64%, wit.ai  - 7.94%, Bing Speech - 11.73%, Apple Dictation -  14.24%.


В основе системы распознавания речи Mozilla лежит (https://research.mozilla.org/machine-learning/) движок
DeepSpeech (https://github.com/mozilla/DeepSpeech), созданный с использованием открытой компанией Google платформы машинного обучения TensorFlow (https://www.opennet.me/opennews/art.shtml?num=46058). DeepSpeech реализует в коде одноимённую архитектуру распознавания речи, предложенную (https://arxiv.org/abs/1412.5567) исследователями из компании Baidu. Предложенный (https://github.com/mozilla/DeepSpeech) Mozilla набор помимо  модели распознавания речи и примеров произношения включает готовые к применению модули  для Python и NodeJS, позволяющие без лишних усложнений встроить в свои программы функции распознавания речи. Также поставляется инструментарий для распознавания из командной строки. Движок распознавания речи достаточно быстр и не требователен к ресурсам, что позволяет использовать его даже на платах Raspberry Pi.


DeepSpeech значительно проще традиционных систем и при этом обеспечивает более высокое качество распознавания при наличии постороннего шума. В разработке не используются традиционные акустические модели и концепция фонем, вместо которых применяется хорошо оптимизированная система машинного обучения на основе нейронной сети, что позволяет обойтись без разработки отдельных компонентов для моделирования различных отклонений, таких как шум, эхо и особенности  речи.  Особенностью DeepSpeech  является то, что для получения качественного распознавания данная архитектура требует большого объёма разнородных данных для осуществления обучения, надиктованных в реальных условиях разными голосами и при наличии естественных шумов.

Опубликованный набор голосовых данных не ограничен применением в DeepSpeech и может оказаться полезным и для других открытых проектов, занимающихся распознаванием речи, таких как Sphinx (https://cmusphinx.github.io/), Kaldi (https://sourceforge.net/projects/kaldi/),  VoxForge (http://www.voxforge.org/), ISIP (https://www.isip.piconepress.com/projects/speech/), HTK (http://htk.eng.cam.ac.uk/) и Julius (http://julius.osdn.jp/en_index.php). До сих пор исследователям и разработчикам были доступны только ограниченные наборы голосовых данных, а стоимость полноценных коллекций голосовых выборок исчислялась десятками тысяч долларов, что сильно тормозило независимые исследования в области распознавание речи. В настоящее время работа сосредоточена только на распознавании английского языка, но в первой половине 2018 года планируется приступить к сбору примеров произношения для других языков.


URL: https://blog.mozilla.org/blog/2017/11/29/announcing-the-init.../
Новость: http://www.opennet.me/opennews/art.shtml?num=47648

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


2. "Проект Mozilla выпустил открытую систему распознавания речи"  +7 +/
Сообщение от Аноним (-), 29-Ноя-17, 20:54 
Качественное распознавание голоса без зондов, впервые.
Ответить | Правка | Наверх | Cообщить модератору

19. "Проект Mozilla выпустил открытую систему распознавания речи"  –10 +/
Сообщение от Аноним (-), 29-Ноя-17, 22:29 
Мозилла? Без зондов? Хорошая шутка. В браузере килотонны телеметрии.
Ответить | Правка | Наверх | Cообщить модератору

23. "Проект Mozilla выпустил открытую систему распознавания речи"  +4 +/
Сообщение от Аноним (-), 29-Ноя-17, 22:41 
Как вы тут такие вообще представляете себе распознавание речи без телеметрии и накоплении глобальных баз данных?
Ответить | Правка | Наверх | Cообщить модератору

28. "Проект Mozilla выпустил открытую систему распознавания речи"  –4 +/
Сообщение от Аноним (-), 29-Ноя-17, 22:53 
Да-да, отличная причина толкать всем умные телевизоры сосунг со встроенными микрофонами и камерой. Замечательное оправдание. ;)
Ответить | Правка | Наверх | Cообщить модератору

31. "Проект Mozilla выпустил открытую систему распознавания речи"  +2 +/
Сообщение от Аноним (-), 29-Ноя-17, 23:00 
Да-да, отличная причина толкать всем умные телефоны сосунг со встроенными микрофонами
и камерой. Замечательное оправдание. ;)

#оченьбыстрофикс


Ответить | Правка | Наверх | Cообщить модератору

36. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Вулх (?), 29-Ноя-17, 23:23 
Где новость, а где телевизоры, вы читали тест новости и текст комментария на который отвечаете?
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

56. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от Аноним (-), 30-Ноя-17, 20:39 
Со временем уберут, надо только научиться мыслепреступления прямо из мозга считывать.
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

44. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от meequz (ok), 30-Ноя-17, 11:06 
По-твоему, телеметрия и зонды это синонимы?
Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

50. "Проект Mozilla выпустил открытую систему распознавания речи"  –1 +/
Сообщение от Аноним (-), 30-Ноя-17, 13:30 
Применительно к Веб - да.
Ответить | Правка | Наверх | Cообщить модератору

66. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 01-Дек-17, 16:20 
> Качественное распознавание голоса без зондов, впервые.

За мозиллой это еще неплохо бы проверить. Там какая-то питонятина навалена, да еще с предложением вгружать ее по сети, без аутентификации. Что там реально закачается в результате, одному ктулху известно.

Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

3. "Проект Mozilla выпустил открытую систему распознавания речи"  –1 +/
Сообщение от Аноним (-), 29-Ноя-17, 20:54 
Чего говорите, "расширения отвалились"? Извините, мы делаем очередную распознавалку речи.
Ответить | Правка | Наверх | Cообщить модератору

4. "Проект Mozilla выпустил открытую систему распознавания речи"  +23 +/
Сообщение от Free Speech (?), 29-Ноя-17, 20:55 
Херня все это. KDE тоже 100 лет назад что-то выпустил, a воз и ныне там. Вот нашел - Simon называется. Она даже английский за столько лет нормально распарсить не научилась, остальных языков при нашей жизни точно не дождемся.

https://simon.kde.org/

Есть еще несколько опенсорсных распознавалок речи, и все они мягко говоря так же в жопе. Почему с мозиллой будет по-другому?

Ответить | Правка | Наверх | Cообщить модератору

5. "Проект Mozilla выпустил открытую систему распознавания речи"  –3 +/
Сообщение от A.Stahl (ok), 29-Ноя-17, 21:00 
>Почему с мозиллой будет по-другому?

Дай я тебе помогу и процитирую немного статью. Там просто нужная для тебя информация была через очень-очень много букв и ты, видимо, устал читать.

>Число ошибок распознавания составляет 6.5% ... уровень ошибок при распознавании человеком оценивается в 5.83%

Ответить | Правка | Наверх | Cообщить модератору

6. "Проект Mozilla выпустил открытую систему распознавания речи"  +17 +/
Сообщение от Виталий Нилл (?), 29-Ноя-17, 21:12 
Давай теперь я тебе кое-что расскажу. Уже 10 лет читаю, не меньше, в пресс-релизной инфе вот таких опенсорсных поделий, похожие цифры: "Мы добились офигительных результатов, высокая точность распознавания и все такое". 10 лет читаю, а в дистрибутивах до сих пор тыкаюсь мышкой и набираю с клавиатуры. Вопрос: Если все в вашей реальности так о%енно, то почему обещания не превращаются в нечто материальное? В то чем можно пользоваться в повседневности? Нахрен все это, если мы будем тыкаться мышкой и клавой еще 10 лет?
Ответить | Правка | Наверх | Cообщить модератору

8. "Проект Mozilla выпустил открытую систему распознавания речи"  –7 +/
Сообщение от A.Stahl (ok), 29-Ноя-17, 21:27 
Не знаю как там в вашей рельности уродило сено, но в моей всякие Сири/Кортаны и прочие давно уже заняли нишу и показывают хорошие результаты. Попробуй ковокс отключить -- его писки могут заглушать твой голос мешая распознаванию.
Ответить | Правка | Наверх | Cообщить модератору

10. "Проект Mozilla выпустил открытую систему распознавания речи"  +9 +/
Сообщение от zubastik (?), 29-Ноя-17, 21:35 
Мсье тyпой или прикидывается? С каких пор сири/кортавая стала опенсорсом? Почему ты сравниваешь закрытый коммерческий продукт титанов индустрии с наколенными бесплатными опенсорсными пoделками?
Ответить | Правка | Наверх | Cообщить модератору

11. "Проект Mozilla выпустил открытую систему распознавания речи"  –4 +/
Сообщение от A.Stahl (ok), 29-Ноя-17, 21:38 
Потому что новость почитай. На базе чего сделана эта титаническая "наколенная поделка".
Впрочем, у меня бисер закончился. На сегодня хватит.
Ответить | Правка | Наверх | Cообщить модератору

46. "Проект Mozilla выпустил открытую систему распознавания речи"  +2 +/
Сообщение от Аноним (-), 30-Ноя-17, 11:09 
На базе открытой платформы со странными лицензиями?

Однако, приводя в пример закрытые системы в виде Кортавой и Сри, в таком случае стоит вспомнить IBM и из OS/2 3 Warp, в которой распознавалка IBM ViaVoice шла "из коробки". К сожалению, только английский был. Русским они тоже делали вместе с нашими специалистами, но, видимо, всё заглохло. Зато эта ViaVoice была портирована в Linux и распространялась бесплатно, но оставалась закрытой.

Так что ваши Картаны и проч. -- хомячкой пример, что не удивительно.

Мазила изобрела велосипед. Дело нужное.

Ответить | Правка | Наверх | Cообщить модератору

47. "Проект Mozilla выпустил открытую систему распознавания речи"  +2 +/
Сообщение от Клыкастый (ok), 30-Ноя-17, 12:18 
> в таком случае стоит вспомнить IBM и из OS/2 3 Warp

и работала же, зараза такая. правда люди всё попадались непередовые. поиграются с голосовым управлением и назад к клаве и мышке.

Ответить | Правка | Наверх | Cообщить модератору

51. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 13:37 
Так и представляю гиков в консоли без клавы, но с голосовым вводом.
Ответить | Правка | Наверх | Cообщить модератору

57. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 20:43 
И с трехмертым пальцетыкательным интерфейсом. И требование диплома об окончании дирижерского факультета от айтишников.
Ответить | Правка | Наверх | Cообщить модератору

69. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 01-Дек-17, 17:27 
> Мазила изобрела велосипед. Дело нужное.

Когда мозилла изобретает велосипед, получается ашанбайк-двухподвес. Тяжелый, кривой, но выглядит почти как настоящий.

Ответить | Правка | К родителю #46 | Наверх | Cообщить модератору

33. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 29-Ноя-17, 23:10 
Пробовал Кортаной проги запускать, работало только на некоторых. А на "open telegram" после нескольких неудач начало искать в инете "woman taliban"...
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

38. "Проект Mozilla выпустил открытую систему распознавания речи"  –2 +/
Сообщение от Аноним (-), 29-Ноя-17, 23:45 
Половина зубов хотя бы на месте? Что с прикусом? Я честно хз с ваших проблем с Кортаной на англ. Я с Сири плотно шпарю по-русски уже пару лет. А она только расцветает, красава ;)
Она у меня даже склонения имён и фамилий из контактов распознаёт. Я могу ей давать задания почти как живому человеку. Ему(!) давать задания - кому как нравится.


Ответить | Правка | Наверх | Cообщить модератору

49. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от microsoft (?), 30-Ноя-17, 13:05 
> Я честно хз с ваших проблем с Кортаной на англ.

понимаете какое дело - суть картавой не в хорошем угадаве речи, а в хорошем угадаве что именно интересно (не "нужно") пользователю (для этого, а вовсе не для голосовой распознавалки, она want to know you closely).
Поэтому, если она у вас регулярно ищет "талибан" - дело не только в дефектах речи, и мы бы советовали не услуги логопеда, а поменьше посещать сайты для шахидов и фейсбучные тусовки по-читателей корана. А то телеметрия в ЦРУ отправляется, знаете-ли, автоматически, и в какой-то непрекрасный момент вас примут в аэропорту.

Ответить | Правка | Наверх | Cообщить модератору

58. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 20:45 
Майкроствт гнобит Кортану. Предсказуемо.
Впрочем, все равно надо идти на речной вокзал.
Ответить | Правка | Наверх | Cообщить модератору

45. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от username (??), 30-Ноя-17, 11:09 
Мало того, сири в машине не англ имена и фамилии крайне плохо распознает. Может бы и пользовался для набора но пока внучную в с меню быстрее будет.
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

21. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от rshadow (ok), 29-Ноя-17, 22:33 
Все распознавалки которые я щупал были похожи на выдернутые откуда то потрошка. Куски кода, без вменяемого интерфейса. Они работали, и даже неплохо, но чтобы их применить нужно быть программистом. Есть отличные наработки, а законченные продукты только у проприетарщиков.

Тот же SaLT например: кормишь ему словарь из нескольких слов и он четко определяет какое слово произнесено, но блин просто срет логом и даже через пайп не понятно как команду запустить на конкретное слово. Как в том анекдоте: ответ абсолютно верный, и абсолютно бесполезный.

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

63. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Anonymoustus (ok), 01-Дек-17, 10:10 
10 лет? Посмеялся, спасибо. Эти занимаются уже несколько десятилетий, да при финансировании и поддержке, да при невероятном улучшении доступных аппаратных ресурсов — но всё как-то без решительных побед.
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

67. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 01-Дек-17, 16:22 
>>Число ошибок распознавания составляет 6.5% ... уровень ошибок при распознавании человеком оценивается в 5.83%

А еще каждый год выходят прессрелизы о том что придумана новая технология аккумуляторов, так что вот-вот гаджеты будут работать целый год без подзарядки. Но пока единственный такой гаджет - наручные часы. Не умные нифига, да и то если подсветкой не сильно пользоваться.

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

9. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от Orduemail (ok), 29-Ноя-17, 21:34 
> KDE тоже 100 лет назад что-то выпустил

Даже если бы он выпустил что-то не 100 лет назад, а 10, то это пoдeлиe морально устарело бы и единственным подходящим ему местом был бы музей. С тех пор технологии распознавания речи продвинулись очень сильно. Причём не только в теоретическом плане, но и в технологическом -- сегодня есть, например, тот же тензорфлоу.

Плюс в новости же есть описание, что мало всяких там технологий, Мозилла создала базу данных для обучения: эти данные сегодня -- полдела в разработке очередного применения AI.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

17. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 29-Ноя-17, 22:18 
Значит скоро нас ждут большие возможности?? Или не ждут. Я запутался.
Ответить | Правка | Наверх | Cообщить модератору

73. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от mommy (?), 13-Янв-20, 08:55 
Неа не будут, тезор выпилен из дебианов ибо собираецо соожна
Ответить | Правка | Наверх | Cообщить модератору

12. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от Я. Р. Ош (?), 29-Ноя-17, 22:02 
Начнём с того, что это не KDE изначально выпустила этот проект.
Остальной твой звиздежь, если продраться через школололо обороты, такого же качества и достоверности.
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

34. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Виталийemail (??), 29-Ноя-17, 23:14 
так раньше на телеге ездили, не все сидят и ждут как ты
не получилось у тебя аргументированной критики дружище
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

48. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от iPony (?), 30-Ноя-17, 12:27 
> Херня все это. KDE тоже 100 лет назад что-то выпустил, a воз и ныне там... Почему с мозиллой будет по-другому?

Сравнивал называется наколенных делателей десктопа, которых уже даже из Suse Enterprise выгнали с крупным игроком браузерного рынка.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

18. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от разговоры с браузером (?), 29-Ноя-17, 22:20 
Когда запилят в браузер? Будет ли встроенная телеметрия по сбору голосов в АНБ?
Ответить | Правка | Наверх | Cообщить модератору

20. "Проект Mozilla выпустил открытую систему распознавания речи"  +5 +/
Сообщение от АНБ (?), 29-Ноя-17, 22:30 
ты чо, совсем дурак, что-ли? Мы для чего эту технологию-то спонсируем, чтоб тонны твоего унц-унц-унц хранить на своих дисках? Телеметрия будет собирать не голос, а распознанный текст, в котором мы сможем пользоваться удобным поиском.

Ответить | Правка | Наверх | Cообщить модератору

30. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от Аноним (-), 29-Ноя-17, 22:54 
Я тебе недоверяю.
Ответить | Правка | Наверх | Cообщить модератору

40. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от АНБ (?), 30-Ноя-17, 00:12 
А для нас это и не важно.
Ответить | Правка | Наверх | Cообщить модератору

71. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от ЦРУ (?), 02-Дек-17, 12:26 
Коллеги, не хотелось мне о работе но ладно. Не надо заниматься распознаванием на устройстве, потом не проверить ж. Проще к нам высылать, а мы там это как можем. Люди разные бывают, поэтому иногда тут только ручной анализ работает.
Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору

22. "Проект Mozilla выпустил открытую систему распознавания речи"  –2 +/
Сообщение от Аноним (-), 29-Ноя-17, 22:40 
Я думаю, что до той же Сири там всегда будет как до Китая раком, хотя бы потому, что пользователей Сири не спрашивают, что они хотят передавать голосом на серверы, а что нет. Последние пару лет я везде где возможно использую голосовое взаимодействие с устройствами и меня эта тётка уже реально пугает. 4 года назад ещё так не пугала. С ней уже можно просто разговаривать, чего никак не скажешь о гугль-ассистенте, хотя, казалось бы, должно быть наоборот. Видимо, у двух компаний разный кпд и выхлоп ;)
Ответить | Правка | Наверх | Cообщить модератору

26. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 29-Ноя-17, 22:51 
Я думаю он вообще не выйдет. Пошумят и заглохнет, как всегда.
Ответить | Правка | Наверх | Cообщить модератору

41. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 02:58 
А знаете ведь так и есть в крупных компаниях вообще очень сложно сделать любое начинание. В основном сплошной саботаж. Это я сейчас про Microsfot в частности говорю. Хотя сверху все вполне красиво выглядит в самом низу полнейший кошмар ... К сожалению, жто и погубит майкрософт скорее всего да впрочем любуюкомпанию.

У меня деж теория есть что развиваться может только небольшой стратап остальные только стагнировать и умирать...

Ответить | Правка | Наверх | Cообщить модератору

37. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Виталийemail (??), 29-Ноя-17, 23:43 
Похоже вы путаете распознавание голоса с искусственным интеллектом и биг датой используемые в сири для общения с вами.
Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

64. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Anonymoustus (ok), 01-Дек-17, 10:16 
Сири только притворяется тёткой. На самом деле в аппаратной сидят бородатые индусы в наушниках с микрофоном.
Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

42. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 10:12 
Вы видели картинки этой системы? Как можно что-то в нее сказать, если во рту микрофон в виде лакомки???
Ответить | Правка | Наверх | Cообщить модератору

43. "Проект Mozilla выпустил открытую систему распознавания речи"  +2 +/
Сообщение от Аноним (-), 30-Ноя-17, 11:00 
Для русского языка имхо лучше KALDI с натренировонной моделью http://alphacephei.com/kaldi/kaldi-ru-0.3.tar.gz в опенсорсе ничего нет. Есть ещё sphinx, тоже хорош и тренируем. Но Kaldi показала лучше.
Был loguendo ASR, но он продавался только телекомам за какие то неопредлённые деньги, а сейчас вообще в недрах nuance канул. Да и без исходников он был.

Так что для русского языка KALDI очень хорош. Каналы по теме
https://t.me/cmusphinx
https://t.me/cmusphinx_ru

Ответить | Правка | Наверх | Cообщить модератору

52. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 30-Ноя-17, 14:46 
а саму модель-то я не нашёл.
Ответить | Правка | Наверх | Cообщить модератору

54. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Alex (??), 30-Ноя-17, 18:39 
https://github.com/mozilla/DeepSpeech/releases/download/v0.1...
Ответить | Правка | Наверх | Cообщить модератору

55. "Проект Mozilla выпустил открытую систему распознавания речи"  –1 +/
Сообщение от rvs2016 (ok), 30-Ноя-17, 20:33 
А кто-нибудь делает ли системы распознавания речи, которые умеют эту речь распознавать без интернета? А то распознают речь не на устройствах пользователя, а на своих серверах, к которым доступ может в любое время отвалиться и ещё чем-то там пытаются гордиться. :-)
Ответить | Правка | Наверх | Cообщить модератору

61. "Проект Mozilla выпустил открытую систему распознавания речи"  +1 +/
Сообщение от Аноним (-), 01-Дек-17, 03:57 
вот как раз Мозилла и сделала такую. Есть ещё cmu sphinx и julius, но это по сравнению с нейросетевыми вообще рандом.
Ответить | Правка | Наверх | Cообщить модератору

65. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 01-Дек-17, 12:38 
KALDI на нейросетках
Ответить | Правка | Наверх | Cообщить модератору

62. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Anonymoustus (ok), 01-Дек-17, 10:06 
Браузер-то уже достиг совершенства — почему бы не попробовать силы в чём-то ещё.
Ответить | Правка | Наверх | Cообщить модератору

68. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от Аноним (-), 01-Дек-17, 16:23 
> Браузер-то уже достиг совершенства — почему бы не попробовать силы в чём-то ещё.

На вид это еще больше макет программы чем мозильский браузер.

Ответить | Правка | Наверх | Cообщить модератору

70. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от DmA (??), 01-Дек-17, 23:11 
Чтобы сделать нормальную распознавалку речи, нужно начинать не с какого-то одного языка, а с  распознавания международного фонетического алфавита(фактически всех звуков, которые использует горло для передачи звуков речи). Далее создавать словари всех языков мира, в которых слова на каком-то языке записаны символами этого международного алфавита и искать по базе слов.Если такой набор звуков есть а нескольких языках, то тут уже спрашивать у человека, какой он предпочитает язык выдачи.
Ответить | Правка | Наверх | Cообщить модератору

72. "Проект Mozilla выпустил открытую систему распознавания речи"  +/
Сообщение от rvs2016 (ok), 13-Ноя-19, 15:33 
А как эту систему распознавания речи прикрутить к своему сайту? Ну чтобы не гугло-распознавателями через гугло-серверы распознавать, а только через свой сервер.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру