<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Facebook опубликовал открытую систему распознавания речи Wav...</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html</link>
    <description>Разработчики из лаборатории искусственного интеллекта Facebook AI Research представили (https://code.fb.com/ai-research/wav2letter/) первый выпуск (https://github.com/facebookresearch/wav2letter/releases) новой системы распознавания речи Wav2letter++ (https://github.com/facebookresearch/wav2letter/), построенной с использованием свёрточной нейронной сети. В отличие от опубликованного (https://www.opennet.ru/opennews/art.shtml?num=47842) в январе начального прототипа, реализация wav2letter++ полностью переписана на языке C++ с использованием библиотек ArrayFire (https://github.com/arrayfire/arrayfire) и Flashlight (https://github.com/facebookresearch/flashlight) (первый прототип был в форме Torch-модуля на языке Lua).  Код проекта распространяется (https://github.com/facebookresearch/wav2letter) под лицензией BSD. Доступны уже натренированные модели (1 (https://s3.amazonaws.com/wav2letter/models/librispeech-glu-highdropout.bin), 2 (https://s3.amazonaws.com/wav2letter/models/librispeech-glu-highdropout-cpu.bin)</description>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#54</link>
    <pubDate>Mon, 31 Dec 2018 08:06:35 GMT</pubDate>
    <description>Натренированные модели от предыдущей версии, с этой не стыкуются.&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#53</link>
    <pubDate>Thu, 27 Dec 2018 08:49:34 GMT</pubDate>
    <description>самое интересное можно оставить на потом, в начале возможен модульный pipeline с максимальной разбивкой по задачам, там как раз старые библиотеки пригодятся даже sox c ffmpeg, только не ждите доброго от меня, старого дурака, вот еще вам https://www2.securecms.com/ICASSP2017/Papers/AcceptedPapers.asp http://www.redhenlab.org/home/the-cognitive-core-research-topics-in-red-hen/audio-processing-pipeline&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним3)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#52</link>
    <pubDate>Wed, 26 Dec 2018 22:28:49 GMT</pubDate>
    <description>Спасибо! Но в списке, вроде, большинство научные пробы или общие библиотеки для работы с аудио: кое-что старое (yaafe, CLAM), кое-что активное (librosa).&lt;br&gt;&lt;br&gt;По ключевому слову &quot;Speaker Diarization&quot; находится действительно кое-что. Самое интересное для получения общего представления было написано всего 7 дней назад!&lt;br&gt;https://medium.com/&#064;jaspreetuseducation/speaker-diarization-22121f1264b1&lt;br&gt;Speaker Diarization - Separation of Multiple Speakers in an Audio File.&lt;br&gt;&lt;br&gt;Жаль, что готовое есть только онлайн от Гугла и других гигантов Амазон, Майкрософт.&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#51</link>
    <pubDate>Wed, 26 Dec 2018 17:25:32 GMT</pubDate>
    <description>https://pastebin.com/pystDU4C&lt;br&gt;в рф это уже делали и не раз&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Андрей)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#50</link>
    <pubDate>Wed, 26 Dec 2018 14:53:20 GMT</pubDate>
    <description>Да-с, выходит как бы с нуля начинать.&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Владимир)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#49</link>
    <pubDate>Wed, 26 Dec 2018 10:53:40 GMT</pubDate>
    <description>С OpenGL не перепутал?&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#48</link>
    <pubDate>Mon, 24 Dec 2018 17:16:31 GMT</pubDate>
    <description>OpenCL уже похоронили, теперь все верят в Vulkan&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#47</link>
    <pubDate>Mon, 24 Dec 2018 11:38:00 GMT</pubDate>
    <description>вообщем, как-то так это выглядит: speaker diarization system (sad/vad + change point detection in time series + counting + indexing + segmentation + homogeneous model forming + reducing the dimensionality + clustering + re-segmentation + tracking)&lt;br&gt;</description>
</item>

<item>
    <title>Facebook опубликовал открытую систему распознавания речи Wav... (Аноним)</title>
    <link>https://www.opennet.me/openforum/vsluhforumID3/116144.html#46</link>
    <pubDate>Mon, 24 Dec 2018 09:58:33 GMT</pubDate>
    <description>не попроще (speaker recognition/speech recognition), попроще можно привязать к другой биометрии&lt;br&gt;</description>
</item>

</channel>
</rss>
