URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 9329
[ Назад ]

Исходное сообщение
"анализ звуковых слов"

Отправлено Николай , 16-Дек-11 18:48 
Доброе время суток всем!
Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова из файла,который формируется путём произношения в микрофон  в виде wav файла.
Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон ловит звук-создаётся файл wav этого произношения и как только в этом файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая через usb...
никто подобным не разбирался?
Очень было бы интересно узнать и обсудить многое по данной тематике.

Содержание

Сообщения в этом обсуждении
"анализ звуковых слов"
Отправлено PavelR , 16-Дек-11 20:51 
>[оверквотинг удален]
> Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
> из файла,который формируется путём произношения в микрофон  в виде wav
> файла.
> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
> ловит звук-создаётся файл wav этого произношения и как только в этом
> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
> через usb...
> никто подобным не разбирался?
> Очень было бы интересно узнать и обсудить многое по данной тематике.

в общем-то к программированию под юникс это имеет весьма малое отношение.


"анализ звуковых слов"
Отправлено Николай , 17-Дек-11 16:09 
>[оверквотинг удален]
>> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
>> из файла,который формируется путём произношения в микрофон  в виде wav
>> файла.
>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>> ловит звук-создаётся файл wav этого произношения и как только в этом
>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>> через usb...
>> никто подобным не разбирался?
>> Очень было бы интересно узнать и обсудить многое по данной тематике.
> в общем-то к программированию под юникс это имеет весьма малое отношение.

не сглашусь..вот к примеру реализация под Unix
http://www.xakep.ru/magazine/xa/133/082/1.asp


"анализ звуковых слов"
Отправлено PavelR , 18-Дек-11 00:30 
>[оверквотинг удален]
>>> файла.
>>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>>> ловит звук-создаётся файл wav этого произношения и как только в этом
>>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>>> через usb...
>>> никто подобным не разбирался?
>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>> в общем-то к программированию под юникс это имеет весьма малое отношение.
> не сглашусь..вот к примеру реализация под Unix
> http://www.xakep.ru/magazine/xa/133/082/1.asp

с чем "не соглашусь" ?

Работа по созданию "звуковой модели" и движка (festival) или работы по написанию анализатора голоса - не unix-специфичны.

В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но - он уже должен быть имеющимся.


"анализ звуковых слов"
Отправлено Николай , 19-Дек-11 09:29 
>[оверквотинг удален]
>>>> никто подобным не разбирался?
>>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>>> в общем-то к программированию под юникс это имеет весьма малое отношение.
>> не сглашусь..вот к примеру реализация под Unix
>> http://www.xakep.ru/magazine/xa/133/082/1.asp
> с чем "не соглашусь" ?
> Работа по созданию "звуковой модели" и движка (festival) или работы по написанию
> анализатора голоса - не unix-специфичны.
> В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но
> - он уже должен быть имеющимся.

Я имел ввиду может кто уже начинал дел по созданию своей собственно системы распознавания речи,которая работала бы в том числе и в Unix-системах..например аналог Сфинкса(Sphinx) или Julius, которые понимали бы русский язык и русскую речь...вот собственно весь и вопрос
...не столь важно на какой основе они работать будут..главное чтобы понимали русскую речь...просто хотелось бы чтобы эта система работала в Linuxe(более привычнее), но не обязательно конечно...
вопрос касается именно создания(написания) такого рода системы...чтобы эту систему можно было использовать в корпоративной сети без выхода в инет...
подобное реализовала google-команда(google speech recognition api)  и свой сервис дают пока пользоваться, но а что делать если нет выхода в инет?
хотелось бы об этом узнать побольше и реализовать.


"анализ звуковых слов"
Отправлено DeadLoco , 21-Дек-11 05:30 
> хотелось бы об этом узнать побольше и реализовать.

Гуглить в сторону "фонемы" и "морфемы".

В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение паттернов сводится к ФФТ в скользящем окне + байесу.

Зд'лаить хъръш - ъзалатьитьсь.


"анализ звуковых слов"
Отправлено Николай , 21-Дек-11 12:37 
>> хотелось бы об этом узнать побольше и реализовать.
> Гуглить в сторону "фонемы" и "морфемы".
> В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные
> паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение
> паттернов сводится к ФФТ в скользящем окне + байесу.
> Зд'лаить хъръш - ъзалатьитьсь.

А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
просто хотелось бы что-то за основу взять хотя бы...
хотелось бы поподробнее об этом обсудить.



"анализ звуковых слов"
Отправлено DeadLoco , 22-Дек-11 03:17 
> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?

Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они плотненько засекречены. А то, что есть в цывильном быту - реагирует на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская фонетика.

Из всего, что в последнее время попадалось на глаза по теме - вот это наиболее адекватно:

http://www.youtube.com/watch?v=G2Y0oqZOyl0


"анализ звуковых слов"
Отправлено Николай , 23-Дек-11 03:44 
>> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
> Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они
> плотненько засекречены. А то, что есть в цывильном быту - реагирует
> на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская
> фонетика.
> Из всего, что в последнее время попадалось на глаза по теме -
> вот это наиболее адекватно:
> http://www.youtube.com/watch?v=G2Y0oqZOyl0

ролик как-то меньше всего заинтересовал)...мен\ больше сё же технический вопрос интересует-реализация так сказать...однако это и понятно,что есть и побочные эффекты...так сказать наличие акцентов...но в данном случае меня интересует просто нормально произносимые слова на традиционном русском языке без акцентов-единвенная разница-это произносят тект женщины и мужчины...но без какого-либо акцента...
не попадались какие-либо разработки в этой тематике или на базе которых можно попробовать реализовать?



"анализ звуковых слов"
Отправлено DeadLoco , 23-Дек-11 05:54 
> в данном случае меня интересует просто нормально произносимые слова на
> традиционном русском языке

Вы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?

Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете, что здесь написано? Вот так оно звучит. А записывается совершенно иначе. Русский язык в плане фонетики - это безнадега. Полная. Вернее - неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно так же, как неосознанно читается вот такой текст:

94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.


"анализ звуковых слов"
Отправлено Николай , 25-Дек-11 07:01 
>[оверквотинг удален]
> Вы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?
> Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете,
> что здесь написано? Вот так оно звучит. А записывается совершенно иначе.
> Русский язык в плане фонетики - это безнадега. Полная. Вернее -
> неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются
> один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно
> так же, как неосознанно читается вот такой текст:
> 94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3
> 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш
> Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.

Но я думаю не всё же так безнадёга!!!Ведь google как-то разрешил данную задачу....как-то обучил свою систему..и причём неплохо понимает русский язык кстати говоря....может как-то можно создать свою систему и как-то обучить её воспринимать голос дикторов(порядка 100 звуковых файлов wav), чтобы система способна была распознать что говорят именно эти дикторы...разница лишь в том,что дикторы имеются и женские и мужские!...есть какие идеи?


"анализ звуковых слов"
Отправлено anonimouse , 27-Дек-11 06:53 
> ...есть какие идеи?

А то! Дай гуглу денег за сорцы :)



"анализ звуковых слов"
Отправлено Николай , 27-Дек-11 07:18 
>> ...есть какие идеи?
> А то! Дай гуглу денег за сорцы :)

)))лучше социальная инженерия, чем монополисту оплачивать)


"анализ звуковых слов"
Отправлено DeadLoco , 28-Дек-11 21:05 
> )))лучше социальная инженерия, чем монополисту оплачивать)

Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу на халяву?


"анализ звуковых слов"
Отправлено Николай , 29-Дек-11 02:59 
>> )))лучше социальная инженерия, чем монополисту оплачивать)
> Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу
> на халяву?

Да не совсем так! Я имею ввиду под этим термином общедоступное с открытым кодом проект,который могут реализовать любой тех.образованный специалист ...естественно на добровольных началах и цель всего-прогресс в этой области, а не получение какой-либо выгоды...Лично я не ставлю для себя цель-получение какой-либо выгоды, а являюсь энтузиастом с целью самому разобраться в процессе реализации и довести это до любого желающего, который в свою очередь способен что-то дополнить своё и также поделиться своими достижениями в этой области...что в этом плохого?


"анализ звуковых слов"
Отправлено anonymous , 04-Янв-12 23:56 
> было использовать в корпоративной сети без выхода в инет...
> подобное реализовала google-команда(google speech recognition api)  и свой сервис дают

Если речь о корпоративной сети, то думаю бесплатность продукта необязательна:
http://www.speechpro.ru/product/recognition/platform/vn


"анализ звуковых слов"
Отправлено Николай , 05-Янв-12 09:30 
>> было использовать в корпоративной сети без выхода в инет...
>> подобное реализовала google-команда(google speech recognition api)  и свой сервис дают
> Если речь о корпоративной сети, то думаю бесплатность продукта необязательна:
> http://www.speechpro.ru/product/recognition/platform/vn

хм...интересная реализация...а может что есть подобное бесплатно и с открытым кодом?



"анализ звуковых слов"
Отправлено Юрий , 10-Янв-12 12:47 
> хм...интересная реализация...а может что есть подобное бесплатно и с открытым кодvj;tn b

может и есть)))но я думаю врят ли кто поделится этой информацией))уж больно в России энтузиастов мало)))всё за деньги и только)))вот поэтому и прогресса нет)
а идея интересная, соглашусь)