URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 119463
[ Назад ]

Исходное сообщение
"Библиотека для распознавания русской речи на Android и Linux..."

Отправлено opennews , 11-Янв-20 19:27 
Опубликована версия 0.3 библиотеки vosk для локального распознавания слитной речи, поддерживающая русский язык. Для платформы Android подготовлен...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=52171


Содержание

Сообщения в этом обсуждении
"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 19:27 
Русский мат он распознает?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 22:16 
Интересно, отсылает ли эта библиотека телеметрию по частоте использования различных слов.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Суп из потрошков , 12-Янв-20 09:09 
К тебе уже выехали из КГБ нравов.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 19:30 
На сони zx1 не ставится (

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 19:31 
Что пишет? Не ставится через скачивание или через adb?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 22:51 
Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как поставить, чтобы была видна ошибка?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 22:53 
> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
> поставить, чтобы была видна ошибка?

Такое есть?

Menu > Settings > Applications and make sure “Unknown sources” is checked


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено zzz , 11-Янв-20 23:47 
Если бы этой галки не стояло, то он вообще не начал бы ставиться, сперва предложив поставить галку. Очевидно, что раз приложение ставится, значит, галка стоит.

Тут, скорее, надо смотреть в сторону гапсов, поскольку аналогичное поведение я уже как-то наблюдал на старом смартфоне при попытке установить скайп - крутилась установка, потом вылетало сообщение о сбое приложения com.android.чтототам, потом еще немного - и привет "приложение не установлено".


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 12-Янв-20 00:49 
>> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
>> поставить, чтобы была видна ошибка?
> Такое есть?
> Menu > Settings > Applications and make sure “Unknown sources” is checked

Да, поставлена галка. Андроид 5.1.1


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 00:51 
>>> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
>>> поставить, чтобы была видна ошибка?
>> Такое есть?
>> Menu > Settings > Applications and make sure “Unknown sources” is checked
> Да, поставлена галка. Андроид 5.1.1

logcat осилите собрать? adb logcat.

или загрузить проект в android studio и оттуда запустить.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Суп из потрошков , 12-Янв-20 09:10 
А чего не 4?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Ан оНим , 12-Янв-20 19:18 
А работает идеально.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 23:56 
>minSdkVersion 21

Это всё, что надо знать об авторе этого пакета.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 00:02 
>>minSdkVersion 21
> Это всё, что надо знать об авторе этого пакета.

А что с этим не так? Android Lolipop 5.0 выпуска 2014 года.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 00:34 
Сделав такое ограничение все с меньшими версиями де-факто были объявлены у****м*****и, недостойными юзать вашу программу. Это https://ru.wikipedia.org/wiki/Потребительство какое-то, не сказать хуже.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 00:44 
> Сделав такое ограничение все с меньшими версиями де-факто были объявлены у****м*****и,
> недостойными юзать вашу программу. Это https://ru.wikipedia.org/wiki/Потребительство
> какое-то, не сказать хуже.

Там у ndk проблемы с рантаймом C++ для более ранних версий, не все функции поддерживались. Более ранние версии можно поддержать, но не просто.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 01:03 
Понятно. Извиняюсь. Спасибо за информацию.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено groosha , 12-Янв-20 03:40 
По состоянию на май 2019 года на SDK 20 (Android 4.4) и ниже приходилось около 10% устройств.
https://developer.android.com/about/dashboards

Им уже больше 5 лет, закопайте стюардессу. Даже если бы ограничение по SDK 21+ было вызвано не плюсовыми библиотеками, а хотелкой автора, он всё равно прав.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 05:50 
Ну так 10% устройств означает что каждый 10 юзер имеет основания махать факом. Это, типа, мало?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Суп из потрошков , 12-Янв-20 09:12 
У меня 10 ведро и я махаю вам этим самым. Можно?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Злостный Анон , 12-Янв-20 15:36 
Ну, Дунька, ты и дура - не можешь ты этим махать.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 11:19 
Толсто.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 14:29 
в Apple приложениях - до сих пор IOS 8 поддерживают.
А когда он вышел ? 2014 год, то есть 6 лет назад - может стоит откопать стюардессу и сказать что кто-то требует покупать постоянно новые устройства ?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено iPony129412 , 13-Янв-20 06:58 
Пошёл смотреть...
Случайная (вообще нет, ибо первое, что вспомнил просто из приложений):
My Little Pony (игра) - iOS 9
Evernote (заметки) - iOS 11
Termius (ssh клиент) - iOS 10


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 12:16 
дедушка с android-1.0 на nokia. это все что нужно знать про этого анонима.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 07:40 
на спектруме тоже не взлетело

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Я , 12-Янв-20 11:22 
поставилась, работает.
приятно, что ест не так много ресурсов - соня не нагрелась.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 19:33 
@модератор. Видео тут не совсем в тему, к сожалению.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 19:38 
Почему? Там же про концепцию vosk во второй половине доклада?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 19:41 
Это видео про серверное приложение для тренировки, а не про библиотеку для андроида.

Библиотека работает на kaldi доработанном.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 19:35 
Нормально, нужно. Для китайского и японского сделайте плиз, а то у меня небольшие проблемы с переводом устной речи в письменную (звучит одинаково, а пишется по-разному). Онлайн распознавание плохо справляется.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 19:40 
Китайский есть, моделька на гитхабе. Не знаю, насколько надёжно будет работать. Скорее всего, хуже чем по сети. Но может пригодиться.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 19:50 
Японский был бы интересней, почему-то про него все забывают. Китайский я почти не понимаю, японский разговорный и письменный в некоторой мере вполне. Но сложности с тем, как записать, я думаю будут те же (т.е. нужна эвристика и словари с угадыванием и выбором из нескольких вариантов).

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено анонимуслинус , 12-Янв-20 02:03 
с этим и японцы плачут.)) недаром они спрашивают , да и объясняют что значит имя и как пишется)) но штука интересная надо смотреть.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 14-Янв-20 05:14 
Они спрашивают из-за иероглифов - есть много способов записать одни и те же звуки (типа яблоко и йаблоко), плюс все иероглифы имеют по несколько значений. И родители с этим всем любят изгаляться по всякому, когда дают имя ребёнку.
С обычными словами у них всё более-менее понятно, хотя иероглифы усложняют письменность. Кстати, эти иероглифы (около 5 тысяч всего) им нужны только потому, что они слова без пробелов пишут :)

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Суп из потрошков , 12-Янв-20 09:14 
Отаку? Смотришь онимэ без субтитров?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено анонимуслинус , 12-Янв-20 22:29 
у нас эта культура как то не сильно прижилась. хотя да учить японский по аниме проще)) пример реальной речи за бесплатно. а с правильными сабами так ваще огонь)) и я имею ввиду именно реальной речи, а не той что в учебниках. но русский все равно сложнее. ))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Cadet , 14-Янв-20 09:43 
>у нас эта культура как то не сильно прижилась

Зато аниме прижилось.
И рок.
Типичный пример увлечения молодежи.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено axredneck , 14-Янв-20 23:16 
> И рок

Скорее уж рэп
(сам слушаю металл)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Cadet , 14-Янв-20 10:08 
У нас прижились говноозвучки. Я вот не представляю себе, чтобы какой-нибудь рядовой американец взялся озвучивать фильм (да еще выкладывать в безальтернативном порядке). Еще у нас водится такое явление, как закадровый перевод. Который можно встретить разве что в Польше (но там обычно один диктор). В мире царствуют дубляж и субтитры. Дубляж делают редко и в основном для детей. Правда, немцы любят дублировать все подряд и довольно неплохо. Может, потому что там сильна русская культура?

Я уже смотрю французские и немецкие фильмы вообще без перевода. Предварительно посмотрев с ним, конечно. С возрастом озвучки вообще разлюбил, даже профессиональные. А уж дубляжи та еще приторная гадость.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено user90 , 11-Янв-20 19:41 
И практическая польза этого ..? Ну если откинуть киберпанк и "тупые колонки"? ;)

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено AlexYeCu_not_logged , 11-Янв-20 19:47 
>И практическая польза этого ..? Ну если откинуть киберпанк и "тупые колонки"? ;)

Управление различными устройствами, когда руки заняты: ответить на звонок, отклонить звонок, позвонить и т.д.
Аналогично, но для людей с ограниченной подвижностью
Компьютерные игры.
Обучающие упражнения для некоторых профессий.

Пока проблем две: низкое качество распознавания и (там где оно повыше) привязка к не всегда доступным серверам.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено user90 , 11-Янв-20 20:02 
> когда руки заняты

Хорошо, что не рот, ХА-ХА-ХА.

Вот про инвалидов чот не подумал, да.. ну а для игр можно применить вообще_любую технологию))


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено AlexYeCu_not_logged , 11-Янв-20 21:03 
>Хорошо, что не рот, ХА-ХА-ХА.

Если запишешь, как ты ртом управляешь автомобилем, прокладываешь слаботочку под потолком, сортируешь кроликов, пересаживаешь цветы, месишь тесто или убираешь снег — выкладывай на ютуб и кидай ссылку сюда.

Если же твой основной род занятий,  дела по дому или хобби предполагают всё время занятый рот — выкладывать ничего не надо. Хотя оно, наверное, к лучшему, что рот-то у тебя по большей части занят.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено CrazyAlex , 12-Янв-20 04:38 
Ну, кому поржать, а я вот к управлению мультиметром прикрутить попробую.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено JL2001 , 12-Янв-20 13:26 
> Ну, кому поржать, а я вот к управлению мультиметром прикрутить попробую.

у вас мультиметр с андройдом/ линуксом и микрофоном? или это какой-то usb-подключаемый?
ссылку на поглазеть бы


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено CrazyAlex , 12-Янв-20 22:28 
Нет, у меня старенький HP, который умеет управляться по GPIB. А переходник на GPIB тривиально делается из ардуинки.

Впрочем, новых модных USB-подключаемых вроде тоже хватает, но я не интересовался. Сейчас вообще подобного хватает - ЛБП те же.

Хм, а общий выключатель, срабатывающий по команде "гаси всё н@x" тоже, пожалуй, будет неплохой идеей


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено анонимуслинус , 12-Янв-20 22:31 
это к инженерам умного дома. но они тож ох""ревать будут.))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено CrazyAlex , 12-Янв-20 22:35 
Не, это я применительно к своей возне с электроникой. В умном доме посложнее надо, а тут - примитива хватит. В принципе я для мультиметра сфинкса хотел использовать, а тут такой подарок

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено sdkisik , 13-Янв-20 10:24 
>переходник на GPIB тривиально делается из ардуинки.

Не поделитесь ссылкой?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено CrazyAlex , 13-Янв-20 11:18 
https://github.com/Twilight-Logic/AR488

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним ещё один , 11-Янв-20 19:49 
Пользы никакой. Можешь бухать дальше.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Sluggard , 11-Янв-20 19:49 
Инвалидам может помочь голосовой набор. Стенограммы.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Ordu , 11-Янв-20 21:54 
Можно общаться в чате не прибегая к помощи экранной клавиатуры.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено pofigist , 14-Янв-20 14:28 
RealDoll с распознованием речи :)

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Nekrasov33 , 11-Янв-20 19:47 
> Опубликована версия 0.3 библиотеки vosk для локального распознавания слитной речи, поддерживающая
> русский язык. Для платформы Android подготовлен...

чем дальше, тем ближе Алиса Селезнева )



"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 20:01 
set Apocalypse {Алиса Селезнёва}

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 20:33 
У меня есть сири.красиво и просто работает

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 20:49 
И тоже без привязки к серверам?
Здесь фишка именно в том, чтобы командовать железками, не ставя об этом в известность Гугл или Эппл.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Michael Shigorin , 11-Янв-20 23:16 
Человек не догадывается, что это _он_ есть у Сири.  А у гуппла "благодаря" ему -- и окружающие :-/

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 21:19 
Кто чей в этой связке это ещё бабушка надвое сказала.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Ан оНим , 12-Янв-20 19:23 
Угу. Попытка читать релиз нотсы ооочень подводит к этой идее.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Константавр , 11-Янв-20 20:33 
Успехов проекту. Рад, что кто-то занимается этим. Я какое-то время назад пытался толкать паровоз, тренировать сфинкса, но единственное приложение, которое позволяло голосом управлять десктопом (Simon) бросили, с тех пор в этой сфере прям дыра была. Особенно в русской среде.

Рад за разработчиков, но немного не понимаю, а какие приложения подхватят ваш движок? опять всё будет только для Андроида и будет использоваться только шпионящими программами? А полезное? Чтобы голосом сказать "закрой окно", "открой фаерфокс" и пр?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 20:49 
Сейчас много появляется полезных приложений для RPi и мобильных. Rhasspy набирает популярность, например, и куча других умных домов.

В Kodi можно встроить эту распознавалку, управлять голосом, пока руки не дошли, но скоро будет.

Эта библиотека распознаёт гораздо лучше, чем pocketsphinx, тренировать её не нужно.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Константавр , 11-Янв-20 21:05 
>Эта библиотека распознаёт гораздо лучше, чем pocketsphinx, тренировать её не нужно.

Верю. Но меня интересует именно десктоп. Есть полупарализованный знакомый, которому важно иметь нормальное голосовое управление компом. И он не один такой. Линукс когда-то предлагал что-то, что можно (при старании и понимании вопроса) применить, но всё что я знаю находится в стагнации. И распознавалки, и читалки и, тем более, управлялки.

А русскоязычные проекты тем более, вот в Альте, например, было несколько движков чтения (не знаю как сейчас), но как заставить десктопное приложение читать этим движком? они же умеют или espeak, или festival и больше ничего. И толку мне с хороших русскоязычных движков, которыми ни одно приложение не умеет пользоваться?

То же и с этой библиотекой распознавания, ну написали, пара энтузиастов прикрутит это к управлению умным домом, а остальные тупо на андроиде за пользователем будут следить :) А бедным инвалидам так и останется - винда и стандартные движки, которые тоже все теперь любют через сеть работать.

Но я нудю. Наверное.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 21:27 
Сделай сам, вон там пример на питоне есть. Для начала можно все свести к карте соответствий «фраза - шелл-команда»

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 21:38 
> А русскоязычные проекты тем более, вот в Альте, например, было несколько движков
> чтения (не знаю как сейчас), но как заставить десктопное приложение читать
> этим движком? они же умеют или espeak, или festival и больше
> ничего. И толку мне с хороших русскоязычных движков, которыми ни одно
> приложение не умеет пользоваться?

Для чтения у нас есть

https://github.com/alphacep/tn2-wg

Пример

https://raw.githubusercontent.com/alphacep/tn2-wg/master/tes...

Правда, для быстрой работы нужна CUDA + NVIDIA карта. И с ударениями не всегда гладко, работаем над этим.



"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Константавр , 11-Янв-20 22:31 
>CUDA + NVIDIA

Это уже перебор. А результат не так уж и убедителен. Фестиваль почти так же читает. Немного больше проработки чувствуется, но целую куду на это бросать??? А что делать владельцам стааарых лаптопов с интелловской встройкой? Я понимаю, ЖД, какиенить, для оповещения о поезде, могут себе позволить такое. Народ! Спуститесь с небес, на землю, к инвалидам!


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 00:05 
Нвидия дешевле амд, если что. Апушки в любом случае будут давать маржинальный буст и нагреваться до температуры плавления за секуды, можно не рассматривать.

>стааарых лаптопов

Жируете, у вас лаптопы есть. Процессора в старых лаптопах тоже не хватит, например. Давайте жаловаться на процессоры в старых лаптопах.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Константавр , 12-Янв-20 02:35 
На что не хватит? Старые движки на кофеварках работают.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 06:19 
Гляньте RHVoice. Весит немного, работает быстро, но русская (и не только) речь довольно качественная для столь небольшого движка.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 00:03 
>Правда, для быстрой работы нужна CUDA + NVIDIA карта.

Пробовали модель перевести в ONNX и завести инференс на mxnet/plaidml (оба на OpenCL)?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 00:15 
>>Правда, для быстрой работы нужна CUDA + NVIDIA карта.
> Пробовали модель перевести в ONNX и завести инференс на mxnet/plaidml (оба на
> OpenCL)?

Не до этого пока, синтез как и везде пока хромает.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Michael Shigorin , 11-Янв-20 23:20 
TTS есть, но почти не видящий человек, который это всё направление тащил -- ушёл из компании (и из команды) после закрытия проекта deepsolver, где упёрлись в конфликт SAT-солверов и альтернатив в репозитории.

Для озвучки orca вроде была, этот класс ПО называется screenreader.

Думаю, можно всё так же пользоваться списком рассылки https://lists.altlinux.org/mailman/listinfo/homeros для таких вопросов и обсуждений.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Константавр , 12-Янв-20 00:03 
Не, Альтом я уже давно не пользуюсь, просто привёл пример, что у вас там было несколько пакетов читалок, от которых в самом же дистрибутиве никакой пользы, потому что ни одна программа их не использовала.

Программа  Орка - это издевательство какое-то (было, когда я последний раз этим пробовал пользоваться) оно читает всё что ненужно. А то что нужно - хрен допросисси (инвалиду она больше мешает) и не заткнуть рот ей никак. оооо... Это капец какой-то.

А вообще, именно парализованному человеку важнее управление голосом. И тут совсем туго в линуксе. и дошло одно время даже до того, что из пакетов qt и gtk начали выкидывать поддержку at-spi, мол, всё равно никому не нужна. И на этом, в принципе, я окончательно поставил крест на линуксе как среде с голосовым управлением.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 00:12 
Не знаю как парализованным, но для слепых в вин10 вроде всё есть. Линукс действительно не очень френдли для инвалидов, но при большом желании можно накалякать достаточной для использования поддержки. Правда, делать это придётся более полноценным товарищам. И воркфлоу будет довольно специфический. А в весь софт пропихивать смысла действительно нет (тем более неотключаемо), как это делают сейчас.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено KonstantinB , 12-Янв-20 03:05 
для совсем слепых, мне кажется, мак с его мультитачем будет удобнее - там есть voiceover gestures.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено vosk , 11-Янв-20 20:54 
> "закрой окно"

Упс... Хозяин, похоже, я оконной рамой кота перерубила...


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Дегенератор , 11-Янв-20 21:21 
У меня один раз студент, которому я в конце занятий сказал закрыть все открытые окна, с каменным лицом полез на подоконник. Я даже сразу и не понял в чем дело.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 21:13 
А есть такое же, но со вкусом эсперанто?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Организация Объединённых Тюленей , 12-Янв-20 08:50 
Faru gxin vi mem.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 21:18 
А чем https://github.com/alphacep/vosk от https://pypi.org/project/vosk/ отличается? На первый взгляд разные библиотеки.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 21:32 
> А чем https://github.com/alphacep/vosk от https://pypi.org/project/vosk/ отличается?
> На первый взгляд разные библиотеки.

https://github.com/alphacep/vosk - для тренировки
https://github.com/alphacep/vosk-api - сборка для pypi (загружается на https://pypi.org/project/vosk/)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено corvuscor , 11-Янв-20 22:46 
Главный то вопрос - какая точность распознавания? Понятно, что точнее DeepSpeech, но это сколько в граммах?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 22:51 
> Главный то вопрос - какая точность распознавания? Понятно, что точнее DeepSpeech, но
> это сколько в граммах?

На IWSLT тесте (ted talks)

deepspeech 0.6  (1Gb)                                WER 21.10%

deepspeech tflite для андроида (50Mb)  WER 48.57%

Jasper (Nemo from Nvidia)                         WER 12.9%

Kaldi (aspire model)                                     WER 12.7 (серверная модель)

android-en-us                                              WER 14.3 (модель для андроида)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено corvuscor , 11-Янв-20 23:18 
О, неплохо так. Надо бы потестить.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено QQQQ , 12-Янв-20 18:44 
Что-то я не понял, точность всего 48.57%? Как так если системы распознавания образов в компьютерном зрении имеют уже больше 95% точность, почему тут такая низка тончость?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Annoynymous , 12-Янв-20 19:21 
Потому что маленькая библиотека звуков. Чем больше библиотека — тем меньеше ошибка.

Всегда ваш, К.О.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено corvuscor , 13-Янв-20 04:44 
WER сиречь Word Error Rate. Например.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 23:01 
>alphaceph

Это в честь крайзиса что-ли?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Виталий , 11-Янв-20 23:15 
С микрофона не распознает

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 11-Янв-20 23:18 
> С микрофона не распознает

Модель телефона какая?

Ассистент какой-нибудь в фоне работает?

Желательно ещё logcat посмотреть.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 11-Янв-20 23:49 
>Языковая модель занимает всего 50Мб и работает точнее DeepSpeech (модель размером более 1Гб).
>The index is really huge, it is not expected to fit a memory of single server

Как это понимать?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 06:38 
Это про обучение моделей, а не про само распознавание.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 00:59 
Почему именно 16 kHz в примере?

1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav` (48 kHz)

2. Заменил в примере 16000 на 48000

3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 01:07 
> Почему именно 16 kHz в примере?
> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
> (48 kHz)
> 2. Заменил в примере 16000 на 48000
> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву

В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно `arecord -r 16000`, можно потом с помощью sox перекодировать.

Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 01:11 
>> Почему именно 16 kHz в примере?
>> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
>> (48 kHz)
>> 2. Заменил в примере 16000 на 48000
>> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву
> В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно
> `arecord -r 16000`, можно потом с помощью sox перекодировать.
> Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)

Ещё надо проконтролировать mono/stereo, стерео работать не будет.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 12:26 
Да, все получилось! Распознает достаточно точно, отличная либа.

p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 12:35 
Хотя слово "тест" не хочет ни в какую распознавать.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 12:46 
> Да, все получилось! Распознает достаточно точно, отличная либа.
> p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)

Отлично, да, в следующий раз добавлю strip в сборку.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Анонъ , 12-Янв-20 11:25 
Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм. Зачем грузить проц лишними данными.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 13-Янв-20 06:53 
> Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм.

Вообще-то 8. Потому что человеческий голос до примерно 4кГц. И то - с "телефонным" качеством. Это тех древних штук, где голос как из унитаза.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 03:24 
Попробовал - дико круто!
Такую штуку бы с каким-нибудь Tasker подружить и уже можно было бы какие-то сценарии писать

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 05:32 
> Python on Linux, Windows and RPi

Футыб%#!!! Автыры не смогли в нормальную либу с нормальным апи?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 06:17 
На Python там лишь обёртка для собранной библиотеки.
Просьба в дальнейшем воздержаться от преждевременного гавканья в комментариях, пока не разберёшься что к чему.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 06:23 
> Ожидается поддержка испанского, хинди, арабского и португальского.

А японский?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Vas Yan , 12-Янв-20 09:54 
А также суахили и язык Навахо.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 10:12 
> А также суахили и язык Навахо.

Ваш сарказм неуместен мне кажется https://en.wikipedia.org/wiki/List_of_languages_by_number_of...,_22nd_edition)


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Злостный Анон , 12-Янв-20 15:39 
В очередь, леди, в очередь.

Пусть япона-мама проспонсирует этот проект, тогда и поговорим.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 22:17 
> В очередь, леди, в очередь.
> Пусть япона-мама проспонсирует этот проект, тогда и поговорим.

Никогда этого не случится, и я их прекрасно понимаю. Очень всё плохо с поддержкой cjk в открытых системах.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено QQQQ , 12-Янв-20 18:49 
К сожалению язык перуанских индецев им никак не добавить. Один путешественник лингвист жаловался, что когда у этих индейцев умирает вожд они забывают слово которым звали вождя и ему приходилось часто переделывать словарь который он составлял вплот до переделки каждые два месяца.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено x0r , 12-Янв-20 12:54 
https://github.com/alphacep/vosk-api/issues/13

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 13:23 
> https://github.com/alphacep/vosk-api/issues/13

Спасибо за тестирование, ответил на гитхабе

Под винду скоро сделаем сборку, надо appveyor освоить.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Данил , 12-Янв-20 20:28 
Не подскажете на каких русскоязычных датасетах вы обучали вашу модель?  

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 17:17 
Не ставится:

$ pip3 install vosk
Collecting vosk
  Could not find a version that satisfies the requirement vosk (from versions: )
No matching distribution found for vosk

Чего ему не хватает?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 17:24 
Вдогонку:
$ python3 --version
Python 3.6.9
$ pip3 --version
pip 9.0.1 from /usr/lib/python3/dist-packages (python 3.6)

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 17:30 
> Вдогонку:
> $ python3 --version
> Python 3.6.9
> $ pip3 --version
> pip 9.0.1 from /usr/lib/python3/dist-packages (python 3.6)

pip 9 вроде manylinux2010 не поддерживает, что если попробовать

pip3 install pip --upgrade

сначала?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 17:37 
В Убунту 18.04 обновлять pip можно только через apt, где доступен только 9.0.1. Иначе ломается.

Именно это у меня и произошло:

$ pip3 install pip --upgrade
Collecting pip
  Downloading https://files.pythonhosted.org/packages/00/b6/9cfa56b4081ad1... (1.4MB)
    100% |████████████████████████████████| 1.4MB 606kB/s
Installing collected packages: pip
Successfully installed pip-19.3.1

$ pip3 install vosk
Traceback (most recent call last):
  File "/usr/bin/pip3", line 9, in <module>
    from pip import main
ImportError: cannot import name 'main'


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 17:42 
Не ломается, просто старый надо удалить, его bash подхватывает ошибочно. После обновления можно

/usr/local/bin/pip3 install vosk


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 17:47 
Вот тут ещё много советов на разный вкус:

https://stackoverflow.com/questions/28210269/importerror-can...


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 20:59 
Спасибо, 1-й совет сработал. vosk поставился.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Annoynymous , 12-Янв-20 19:23 
Добавить бы эту библиотечку в какую-нибудь опенсорсную клавиатуру для Android, была бы тема. Кто возьмётся?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 22:13 
Samsung Galaxy J2 андроид 7.1.1 устанлвилось нлрмально, но интерфейс "спартанский" тестовый , и мой голос распознает с ошибками, очень приблизительно

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 22:28 
> Samsung Galaxy J2 андроид 7.1.1 устанлвилось нлрмально, но интерфейс "спартанский" тестовый
> , и мой голос распознает с ошибками, очень приблизительно

Можно сделать запись в файл, я посмотрю.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 22:57 
Не нашел как в программе записать лог, записал видео с процессом
https://yadi.sk/i/61FY7hiOWfwibQ

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 23:09 
> Не нашел как в программе записать лог, записал видео с процессом
> https://yadi.sk/i/61FY7hiOWfwibQ

Ну норм, одно слово пропустил всего. Задержка есть, надо нейросетку оптимизировать ещё.

А где с ошибками-то?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 23:27 
Молодцы! разработка прекрасная, буду думать как ее внедрить.

Про ошибки распознавания: я слишком требователен ))

Из тестов, что не попали в запись, было больше ошибок. Из плюсов: слово редкое по звучанию ("математика") распознавалось надежно, когда несколько созвучных слов было - ошибки были ))

Давно искал подобную офф-лайн библиотеку, надо бы программу на свой специальный словарь натренировать, чтобы на ключевых отраслевых словах не ошибалась.



"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 12-Янв-20 23:35 
> Молодцы! разработка прекрасная, буду думать как ее внедрить.
> Про ошибки распознавания: я слишком требователен ))
> Из тестов, что не попали в запись, было больше ошибок. Из плюсов:
> слово редкое по звучанию ("математика") распознавалось надежно, когда несколько созвучных
> слов было - ошибки были ))
> Давно искал подобную офф-лайн библиотеку, надо бы программу на свой специальный словарь
> натренировать, чтобы на ключевых отраслевых словах не ошибалась.

Хорошо, тренировать можно. Попозже выложим скрипты. Обращайтесь.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 12-Янв-20 23:39 
Спасибо! ))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено de220175 , 29-Янв-20 21:37 
Очень впечатлила ваша работа. Есть желание потренировать вашу модель подскажите где найти скрипты для тренировки, ну или хотя бы укажите направление, с чего начать.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 29-Янв-20 22:23 
> Очень впечатлила ваша работа. Есть желание потренировать вашу модель подскажите где найти
> скрипты для тренировки, ну или хотя бы укажите направление, с чего
> начать.

Начать с изучения kaldi, наверное

https://kaldi-asr.org/doc/kaldi_for_dummies.html

https://github.com/kaldi-asr/kaldi/tree/master/egs/mini_libr...


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 19-Янв-20 14:08 
а где взять серверные модели? не могу нагуглить

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 19-Янв-20 18:08 
> а где взять серверные модели? не могу нагуглить

Сервер:

https://github.com/alphacep/kaldi-websocket-python

Докер для сервера:

docker run -d -p 2700:2700 alphacep/kaldi-ru:latest

Модель русская:

http://alphacephei.com/kaldi/kaldi-ru-0.6.tar.gz

Модель английская:

http://alphacephei.com/kaldi/kaldi-en-us-aspire-0.1.tar.gz


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено хотел спросить , 13-Янв-20 03:05 
А сырцы где? На гитхабе написано, что это байндинги.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено KonstantinB , 13-Янв-20 03:15 
Если вбить в гугл то, на что binding-и, первые же ссылки будут на сорцы.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 13-Янв-20 09:11 
Так а как хотя бы ввести что-то в текстовик или поисковик голосом с помощью этого? На Андроиде

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 13-Янв-20 09:21 
в эстонскую Konele можно добавить в f-droid уже есть

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 13-Янв-20 10:18 
Нужно

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 13-Янв-20 18:55 
Оффлайн распознавалка голоса? Неужели дождались. А то всё питоно-электроно-монстры на 800 мегабайт, являющеся оболочкой над Google Assistant.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено DmA , 14-Янв-20 08:29 
Неужели сбылось то, что обещала 25 лет назад OS/2 Warp -голосовое управление компьютером :)

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Cadet , 14-Янв-20 09:32 
Интересно, это лучше, чем обученный русскому Dragon NaturallySpeaking?
Для оффтопика русские разрабатывают Voco. Вроде бы бесплатно не найти. Системные требования i5, 4Gb RAM, стоимость 1700-14000руб, зависит от версии. А в сабже размер всего 50 мб.
Сделали ли бы прогу для автоматического титрования фильмов. Пусть даже если криво, потом можно исправить ошибки.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Crazy Alex , 14-Янв-20 18:15 
Наоборот - какой смысл в указанной вами проприетарщине, если вот оно - открытое, вполне приемлемо жрущее и неплохо распознающее?

Что до субтитров - это тривиально делается скриптами, я так, помнится, свою коллекцию обучающих видео обрабатывал, чтобы индекс создать для локального поиска. Типа этого: https://github.com/agermanidis/autosub - при желании можно заменить там гугловскую распознавалку на сабж или любую другую альтернативу. Качество выходит дрянь, но для индекса - достаточно.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 15-Янв-20 16:41 
Звучит интересно. Но на Ubuntu 16.04 не поставилось. Лог https://pastebin.com/raw/VB2CdGKk
Failed building wheel for unknown
Попробую на openSUSE Tumbleweed. Там пакеты свежее.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 15-Янв-20 16:44 
Из под sudo можно запускать? А то что-то python pip знатно гадит в хомяк.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Zed , 14-Янв-20 21:20 
На старые дроиды принципиально не дают ставить или же есть объективные причины?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 14-Янв-20 22:09 
> На старые дроиды принципиально не дают ставить или же есть объективные причины?

На старых NDK были проблемы с libstdc++ в части математических функций вроде такой.

https://eigen.tuxfamily.org/bz/show_bug.cgi?id=876

В принципе, можно собрать с небольшим напильником, но лень.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено chukcha , 16-Янв-20 22:17 
А можно ли скрестить эту распознавалку речи с синтезатором речи?
Например, через | (конвеер).

Синтезаторов полно, начиная с "Festival" - http://linux.tiflocomp.ru/docs/ux_synths.php

В результате получится идеальный вокодер, в котором ваш голос уже точно никто не угадает!

Может, в этих "Быстро-новостях" голоса так и сделаны?
https://www.youtube.com/watch?v=-EEDEL63AR8

>


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 13-Апр-20 15:31 
На новой мобиле заработало. На андроид вполне приемлемое качество распознавания, и это при том, что рядом работает стиральная машина ))
@nshmyrev, скажите пожалуйста, а можно ли с помощью этой либы текст выводить в файл просто? Остро, отчаянно не хватает хотя бы простейшей оффлайн-распознавалки и под андроид, и под линукс. Прямо готов объявлять баунти, собирать людей в патреон и т.д.  
Сейчас ситуация с реально_работающим_под_линукс oss софтом для распознавания определяется словом "позор", по-моему. Даже то, что есть в репах, не имеет ни GUI, ни даже CLI интерфейса для простого юзера - я имею в ввиду такого интерфейса, где не нужно было бы задавать километр параметров. И это при том, что куча движков опубликована под свободными лицензиями, и датасетов уже немало.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 13-Апр-20 18:10 
> @nshmyrev, скажите пожалуйста, а можно ли с помощью этой либы текст выводить
> в файл просто? Остро, отчаянно не хватает хотя бы простейшей оффлайн-распознавалки
> и под андроид, и под линукс. Прямо готов объявлять баунти, собирать
> людей в патреон и т.д.
> Сейчас ситуация с реально_работающим_под_линукс oss софтом для распознавания определяется
> словом "позор", по-моему. Даже то, что есть в репах, не имеет
> ни GUI, ни даже CLI интерфейса для простого юзера - я
> имею в ввиду такого интерфейса, где не нужно было бы задавать
> километр параметров. И это при том, что куча движков опубликована под
> свободными лицензиями, и датасетов уже немало.

Можно в файл выводить, на то и библиотека. Под линуксом работает на питоне https://github.com/alphacep/vosk-api а также есть докер сервер:

https://github.com/alphacep/vosk-server

Недавно вышла большая модель с повышенной точностью:

http://alphacephei.com/kaldi/kaldi-ru-0.9.tar.gz


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 13-Апр-20 19:41 
Спасибо за ответ,
vosk-server не ставится через pip3 на bionic, но это, наверное, не ваша проблема ))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 13-Апр-20 19:41 
я хотел сказать, vosk-api не ставится на бионик (

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 13-Апр-20 20:13 
> я хотел сказать, vosk-api не ставится на бионик (

Почему не ставится? pip 19 обновлён?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 14-Апр-20 02:15 
pip3 --version
pip 20.0.2 from /usr/local/lib/python3.6/dist-packages/pip (python 3.6)
Если ввести pip3 install vosk то ставится пакет, в к-ром только _vosk.so - но мне-то нужен vosk-api, нет?
pip3 install vosk-api отвечает
ERROR: Could not find a version that satisfies the requirement vosk-api (from versions: none)
ERROR: No matching distribution found for vosk-api

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 14-Апр-20 09:57 
> pip3 --version
> pip 20.0.2 from /usr/local/lib/python3.6/dist-packages/pip (python 3.6)
> Если ввести pip3 install vosk то ставится пакет, в к-ром только _vosk.so
> - но мне-то нужен vosk-api, нет?
> pip3 install vosk-api отвечает
> ERROR: Could not find a version that satisfies the requirement vosk-api (from
> versions: none)
> ERROR: No matching distribution found for vosk-api

Это он и есть. можно запускать пример.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 14-Апр-20 15:24 
пример? в vosk есть только vosk.py (вы с чайником разговариваете, если что ))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 14-Апр-20 20:14 
> пример? в vosk есть только vosk.py (вы с чайником разговариваете, если что
> ))

Пример тут https://github.com/alphacep/vosk-api/blob/master/python/exam...


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 15-Апр-20 00:44 
Traceback (most recent call last):
  File "./test_simple.py", line 12, in <module>
    wf = wave.open(sys.argv[1], "rb")
IndexError: list index out of range

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 15-Апр-20 03:23 
Файл ему нужно было указать в качестве аргумента, это в readme написано:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
./test_simple.py file.wav


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено gregg , 16-Апр-20 12:35 
В общем, жду и мечтаю, что кроме test_simple.py там будет лежать ещё notepad_simple.py ))

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 27-Июн-20 16:14 
Распознает офигительно. Во влажных мечтах прикрутить к управлению умным домом.

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Вячеслав , 28-Авг-20 07:51 
Не могу установить vosk.
Имею
Win7 prof,64 разряда
Python 3.6.7 (v3.6.7:6ec5cf24b7, Oct 20 2018, 13:35:33) [MSC v.1900 64 bit (AMD64)] on win32
pip 20.2.2

при попытке установки
pip -v install vosk
выдает ошибки
ERROR: Could not find a version that satisfies the requirement vosk-api (from versions: none)
ERROR: No matching distribution found for vosk-api

при попытке установки
pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
выдает ошибку
ERROR: vosk-0.3.1.2-cp37-cp37m-win_amd64.whl is not a supported wheel on this platform

соответственно при попытке импорта
from vosk import Model, KaldiRecognizer
ModuleNotFoundError: No module named 'vosk'

Что не так?


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 28-Авг-20 10:02 
Под Windows поддерживается только Python 3.8 64-bit, 3.6 не поддерживается.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Вячеслав , 28-Авг-20 08:08 
после написания своего поста тупо начал перебирать версии с https://github.com/dtreskunov/tiny-kaldi/releases
версия
https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
вроде загрузилась без ошибок.
продолжаю тестировать

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 28-Авг-20 10:02 
> после написания своего поста тупо начал перебирать версии с https://github.com/dtreskunov/tiny-kaldi/releases
> версия
> https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
> вроде загрузилась без ошибок.
> продолжаю тестировать

Это очень старая, к тому же, неофициальная версия.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Вячеслав , 28-Авг-20 11:09 
Не работает. При запуске примера возникает ошибка: from . import _vosk ImportError: DLL load failed: Не найден указанный модуль. Есть решение?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 28-Авг-20 22:17 
> Не работает. При запуске примера возникает ошибка: from . import _vosk ImportError:
> DLL load failed: Не найден указанный модуль. Есть решение?

1) Запустить python -v чтобы увидеть более подробную информацию о модулях
2) Убедиться, что файл с кодом не называется vosk.py, питон его перепутывает с установленным системным модулем.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Вячеслав , 30-Авг-20 04:20 
установил Python 3.8.5, установил
pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
не хотело ставиться PyAudio, нашел способ...
pip install pipwin
pipwin install PyaAdio
вроде все готово... начало ругаться на отсутствие файлов в модели.
использую легкую модель https://alphacephei.com/vosk/models/vosk-model-ru-0.10.zip
легкая модель распакована как сказано в ролике https://www.youtube.com/watch?feature=youtu.be&v=fPKAOeUo-Rg...
перекинул все файлы из папок модели в папку model, код запустился и повис :( не вылетел, а повис как выяснилось на строке model = Model("model")
дальше не знаю пока чего делать :(



"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 30-Авг-20 11:55 
> установил Python 3.8.5, установил
> pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...

Это старая версия. Надо

pip3 install vosk

или

pip3 install https://github.com/alphacep/vosk-api/releases/download/0.3.7...

> не хотело ставиться PyAudio, нашел способ...
> pip install pipwin
> pipwin install PyaAdio
> вроде все готово... начало ругаться на отсутствие файлов в модели.
> использую легкую модель https://alphacephei.com/vosk/models/vosk-model-ru-0.10.zip

Это большая модель, маленькая тут:

https://alphacephei.com/vosk/models/vosk-model-small-ru-0.4.zip


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Alex , 28-Сен-20 22:45 
Добрый день!

Вопрос по VOSK

Движок поддерживает режим по ключевый словам, по типу, как это реализрванно в Сфинксе?

https://cmusphinx.github.io/wiki/tutoriallm/#keyword_lists


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 28-Сен-20 23:43 
> Добрый день!
> Вопрос по VOSK
> Движок поддерживает режим по ключевый словам, по типу, как это реализрванно в
> Сфинксе?
> https://cmusphinx.github.io/wiki/tutoriallm/#keyword_lists

Нет, пока не поддерживает.

https://github.com/alphacep/vosk-api/issues/107


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Аноним , 16-Ноя-20 23:35 
Здравствуйте. Установил vosk на linux все прекрасно работает. Понадобилось использовать его на Windows 10 возникли проблемы. Версия windows 64-битная. Python версии 3.9.0. pip3 версия 20.2.4. Однако после команды pip3 install vosk выдает ошибку:
ERROR: Could not find a version that satisfies the requirement vosk (from versions: none)
ERROR: No matching distribution found for vosk
Не знаю как решить данную проблемы, если кто-то с таким сталкивался, может подсказать что-то?

"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено nshmyrev , 17-Ноя-20 02:21 
> Здравствуйте. Установил vosk на linux все прекрасно работает. Понадобилось использовать
> его на Windows 10 возникли проблемы. Версия windows 64-битная. Python версии
> 3.9.0. pip3 версия 20.2.4. Однако после команды pip3 install vosk выдает
> ошибку:
> ERROR: Could not find a version that satisfies the requirement vosk (from
> versions: none)
> ERROR: No matching distribution found for vosk
> Не знаю как решить данную проблемы, если кто-то с таким сталкивался, может
> подсказать что-то?

Пока под Windows поддерживается только Python версия 3.8. И то мне её обновить надо, много исправлений не вошло.


"Библиотека для распознавания русской речи на Android и Linux..."
Отправлено Денис , 21-Янв-22 11:38 
Установил библиотеку Python, скачал базу, как это использовать? ОС Linux Mint 20.3