Доброе время суток всем!
Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова из файла,который формируется путём произношения в микрофон в виде wav файла.
Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон ловит звук-создаётся файл wav этого произношения и как только в этом файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая через usb...
никто подобным не разбирался?
Очень было бы интересно узнать и обсудить многое по данной тематике.
>[оверквотинг удален]
> Очень бы хотелось узнать побольше по вопросу анализа звуковых слов...
> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
> из файла,который формируется путём произношения в микрофон в виде wav
> файла.
> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
> ловит звук-создаётся файл wav этого произношения и как только в этом
> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
> через usb...
> никто подобным не разбирался?
> Очень было бы интересно узнать и обсудить многое по данной тематике.в общем-то к программированию под юникс это имеет весьма малое отношение.
>[оверквотинг удален]
>> есть идея собсвенно написать ПО под Linuxom(желательно RedHat), которое анализирует слова
>> из файла,который формируется путём произношения в микрофон в виде wav
>> файла.
>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>> ловит звук-создаётся файл wav этого произношения и как только в этом
>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>> через usb...
>> никто подобным не разбирался?
>> Очень было бы интересно узнать и обсудить многое по данной тематике.
> в общем-то к программированию под юникс это имеет весьма малое отношение.не сглашусь..вот к примеру реализация под Unix
http://www.xakep.ru/magazine/xa/133/082/1.asp
>[оверквотинг удален]
>>> файла.
>>> Хотелось бы допустим при приходе в кв сказать допустим свет и микрофон
>>> ловит звук-создаётся файл wav этого произношения и как только в этом
>>> файле ПО обнаруживает наличие слова "свет" вызывает функцию по включению лампочки,подключённая
>>> через usb...
>>> никто подобным не разбирался?
>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>> в общем-то к программированию под юникс это имеет весьма малое отношение.
> не сглашусь..вот к примеру реализация под Unix
> http://www.xakep.ru/magazine/xa/133/082/1.aspс чем "не соглашусь" ?
Работа по созданию "звуковой модели" и движка (festival) или работы по написанию анализатора голоса - не unix-специфичны.
В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но - он уже должен быть имеющимся.
>[оверквотинг удален]
>>>> никто подобным не разбирался?
>>>> Очень было бы интересно узнать и обсудить многое по данной тематике.
>>> в общем-то к программированию под юникс это имеет весьма малое отношение.
>> не сглашусь..вот к примеру реализация под Unix
>> http://www.xakep.ru/magazine/xa/133/082/1.asp
> с чем "не соглашусь" ?
> Работа по созданию "звуковой модели" и движка (festival) или работы по написанию
> анализатора голоса - не unix-специфичны.
> В некотором роде юникс-специфичными будут задачи встраивания уже имеющегося движка, но
> - он уже должен быть имеющимся.Я имел ввиду может кто уже начинал дел по созданию своей собственно системы распознавания речи,которая работала бы в том числе и в Unix-системах..например аналог Сфинкса(Sphinx) или Julius, которые понимали бы русский язык и русскую речь...вот собственно весь и вопрос
...не столь важно на какой основе они работать будут..главное чтобы понимали русскую речь...просто хотелось бы чтобы эта система работала в Linuxe(более привычнее), но не обязательно конечно...
вопрос касается именно создания(написания) такого рода системы...чтобы эту систему можно было использовать в корпоративной сети без выхода в инет...
подобное реализовала google-команда(google speech recognition api) и свой сервис дают пока пользоваться, но а что делать если нет выхода в инет?
хотелось бы об этом узнать побольше и реализовать.
> хотелось бы об этом узнать побольше и реализовать.Гуглить в сторону "фонемы" и "морфемы".
В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение паттернов сводится к ФФТ в скользящем окне + байесу.
Зд'лаить хъръш - ъзалатьитьсь.
>> хотелось бы об этом узнать побольше и реализовать.
> Гуглить в сторону "фонемы" и "морфемы".
> В общих чертах задача сводится к тому, чтобы в потоке вычленять характерные
> паттерны по спектру и огибающим, и транслировать их в буквосочетания. Вычленение
> паттернов сводится к ФФТ в скользящем окне + байесу.
> Зд'лаить хъръш - ъзалатьитьсь.А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
просто хотелось бы что-то за основу взять хотя бы...
хотелось бы поподробнее об этом обсудить.
> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они плотненько засекречены. А то, что есть в цывильном быту - реагирует на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская фонетика.
Из всего, что в последнее время попадалось на глаза по теме - вот это наиболее адекватно:
>> А сами не создавали подобное либо может подскажете какой продукт это хоть что-то делает?
> Есть отдельные разработки, которые отлавливают ключевые слова в речи, но все они
> плотненько засекречены. А то, что есть в цывильном быту - реагирует
> на пару-тройку слов, произносимых строго одинаково, ибо. Отдельное болото - русская
> фонетика.
> Из всего, что в последнее время попадалось на глаза по теме -
> вот это наиболее адекватно:
> http://www.youtube.com/watch?v=G2Y0oqZOyl0ролик как-то меньше всего заинтересовал)...мен\ больше сё же технический вопрос интересует-реализация так сказать...однако это и понятно,что есть и побочные эффекты...так сказать наличие акцентов...но в данном случае меня интересует просто нормально произносимые слова на традиционном русском языке без акцентов-единвенная разница-это произносят тект женщины и мужчины...но без какого-либо акцента...
не попадались какие-либо разработки в этой тематике или на базе которых можно попробовать реализовать?
> в данном случае меня интересует просто нормально произносимые слова на
> традиционном русском языкеВы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?
Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете, что здесь написано? Вот так оно звучит. А записывается совершенно иначе. Русский язык в плане фонетики - это безнадега. Полная. Вернее - неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно так же, как неосознанно читается вот такой текст:
94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.
>[оверквотинг удален]
> Вы хотя бы отдаленно представляете себе, что такое "традиционный русский язык"?
> Я совершенно не случайно написал выше "Зд'лаить хъръш - ъзалатьитьсь". Вы понимаете,
> что здесь написано? Вот так оно звучит. А записывается совершенно иначе.
> Русский язык в плане фонетики - это безнадега. Полная. Вернее -
> неполная. Неполногласная. Звуки русской речи глохнут, опускаются или вообще заменяются
> один на другой. Восприятие этой каши происходит мозгом совершенно неосознанно, точно
> так же, как неосознанно читается вот такой текст:
> 94НН03 С006Щ3НN3 П0К4ЗЫ8437, К4КN3 У9N8N73ЛЬНЫ3 83ЩN М0Ж37 93Л47Ь Н4Ш Р4ЗУМ! 8П3Ч47ЛЯЮЩN3
> 83ЩN! СН4Ч4Л4 Э70 6ЫЛ0 7РУ9Н0, Н0 С3ЙЧ4С Н4 Э70Й С7Р0К3 84Ш
> Р4ЗУМ ЧN7437 Э70 4870М47NЧ3СКN, Н3 З49УМЫ84ЯСЬ 06 Э70М.Но я думаю не всё же так безнадёга!!!Ведь google как-то разрешил данную задачу....как-то обучил свою систему..и причём неплохо понимает русский язык кстати говоря....может как-то можно создать свою систему и как-то обучить её воспринимать голос дикторов(порядка 100 звуковых файлов wav), чтобы система способна была распознать что говорят именно эти дикторы...разница лишь в том,что дикторы имеются и женские и мужские!...есть какие идеи?
> ...есть какие идеи?А то! Дай гуглу денег за сорцы :)
>> ...есть какие идеи?
> А то! Дай гуглу денег за сорцы :))))лучше социальная инженерия, чем монополисту оплачивать)
> )))лучше социальная инженерия, чем монополисту оплачивать)Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу на халяву?
>> )))лучше социальная инженерия, чем монополисту оплачивать)
> Я так понимаю, под "социальной инженерией" понимается раскрутить кого-то решить вашу задачу
> на халяву?Да не совсем так! Я имею ввиду под этим термином общедоступное с открытым кодом проект,который могут реализовать любой тех.образованный специалист ...естественно на добровольных началах и цель всего-прогресс в этой области, а не получение какой-либо выгоды...Лично я не ставлю для себя цель-получение какой-либо выгоды, а являюсь энтузиастом с целью самому разобраться в процессе реализации и довести это до любого желающего, который в свою очередь способен что-то дополнить своё и также поделиться своими достижениями в этой области...что в этом плохого?
> было использовать в корпоративной сети без выхода в инет...
> подобное реализовала google-команда(google speech recognition api) и свой сервис даютЕсли речь о корпоративной сети, то думаю бесплатность продукта необязательна:
http://www.speechpro.ru/product/recognition/platform/vn
>> было использовать в корпоративной сети без выхода в инет...
>> подобное реализовала google-команда(google speech recognition api) и свой сервис дают
> Если речь о корпоративной сети, то думаю бесплатность продукта необязательна:
> http://www.speechpro.ru/product/recognition/platform/vnхм...интересная реализация...а может что есть подобное бесплатно и с открытым кодом?
> хм...интересная реализация...а может что есть подобное бесплатно и с открытым кодvj;tn bможет и есть)))но я думаю врят ли кто поделится этой информацией))уж больно в России энтузиастов мало)))всё за деньги и только)))вот поэтому и прогресса нет)
а идея интересная, соглашусь)