The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обновление голосовых данных Mozilla Common Voice 16.0

24.12.2023 20:18

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 28.7 до 30.3 тысяч часов речи, из которых 19.7 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 114 до 120 (добавлены идиш, латгальский, лигурийский, осетинский, телугу и западный сьерра-пуэбланский науатль).

В подготовке материалов на английском языке приняли участие 90.67 тысяч человек, надиктовавших 3438 часов речи (было 88.9 тысяч участников и 3347 часов). Набор для белорусского языка охватывает 8249 участников и 1641 час речевого материала (было - 8205 участников и 1632 часа), русского языка - 3133 участника и 265 часов (было 3053 участника и 260 часов), узбекского - 2151 участника и 264 часа (было 2141 участника и 263 часа), украинского языка - 1058 участников и 108 часов (было 1024 участника и 105 часов).

Проект Common Voice нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

  1. Главная ссылка к новости (https://www.soeren-hentzschel....)
  2. OpenNews: Mozilla тестирует систему голосового управления Firefox Voice
  3. OpenNews: NVIDIA инвестирует 1.5 млн долларов в проект Mozilla Common Voice
  4. OpenNews: Компания Mozilla представила движок распознавания речи DeepSpeech 0.9
  5. OpenNews: Проект Mozilla выпустил открытую систему распознавания речи
  6. OpenNews: Новый выпуск системы синтеза речи Silero
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/60345-voice
Ключевые слова: voice, mozilla
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (41) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.4, Аноним (4), 21:08, 24/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Про Мозиллу последнее время или хорошо или ничего.
     
     
  • 2.5, Вы забыли заполнить поле Name (?), 21:51, 24/12/2023 [^] [^^] [^^^] [ответить]  
  • +7 +/
    Живее живых, правда фигней маятся. С другой стороны за такие донаты ты бы тоже маялся. А браузер - это как ремонт, его нельзя закончить, можно только приостановить.
     
     
  • 3.20, Bob (??), 09:18, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Только у браузера с почтовиком от esr к esr стабильно крышу сносит)
    а у менеджмента постоянно свистит в пустом котелке...
     
  • 3.30, Аноним (30), 18:16, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Это не донаты, а 30 сребренников за монополию Google.
     
  • 3.36, Аноним (-), 19:04, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    За какие донаты?
    Пользователей почти 200 млн, а донатов чуть больше 9ти.
    По пять центов с носа! Невероятная щедрость!

    Без денего гугла они вообше уже загнулись https://www.opennet.me/opennews/art.shtml?num=60238
    Спасибо всем кто "убеждает людей, что opensource - это бесплатно", и делает паленки и либрвульфы)

     
     
  • 4.37, Вы забыли заполнить поле Name (?), 19:09, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > За какие донаты?
    > Пользователей почти 200 млн, а донатов чуть больше 9ти.
    > По пять центов с носа! Невероятная щедрость!

    "Донаты" от гугла.

     
     
  • 5.43, Аноним (-), 23:16, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не донаты, а оплата контракта. Которые обе стороны вполне успешно выполняют еще с 2006 года или даже раньше.
     
  • 4.54, Аноним (54), 16:20, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    А почему ты решил что тебе кто-то должен? Ты либо делай opensource или не делай opensource. Ноешь-то зачем?
     
     
  • 5.60, Аноним (60), 21:32, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Он эффективный менеджер среднего звена из Мозиллы, которого вот-вот сократят, а он ничего не умеет, кроме как языком. Вот так и умрет с голоду молодой, подающий надежды, "специалист" на глазах у жадного и чёрствого сообщества. Помогите, люди добрые!
     
  • 4.55, Аноним (54), 16:22, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А зачем Mazilla донаты? https://www.opennet.me/opennews/art.shtml?num=58038
     
  • 4.59, Аноним (60), 21:26, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Коммерческая Мозилла давно победила некоммерческую. Им не донаты собирать, а налоги пора платить, как следует. Да и зачем им деньги, если они их постоянно раздают/инвестируют. Это не разработчик браузера, а филиал корпоративных спонсоров, через который оказывается финансовое давление на другие открытые проекты.

    А сопроводителям Либревульфа (а также ТорБраузера), действительно, спасибо!

     

  • 1.9, Аноним (9), 22:27, 24/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Хотел помочь с раздачей торрентов, но им не жалко халявных денег.
     
  • 1.11, Nick (??), 23:19, 24/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Фигней занимаюся, вместо того, чтобы активно развивать и улучшать браузер
     
     
  • 2.13, Аноним (-), 00:10, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Так с браузера денег не заработаешь, Сообщество решило что браузер должен быть бесплатным (и за это заплатит гугл).
    А тат есть шанс сделать какой-то платный сервис.
     
     
  • 3.32, Аноним (30), 18:20, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ага, особенно можно разбогатеть на бесплатных датасетах. Зато менеджмент продемонстрировал какие они прогрессивные.
     
  • 3.56, Аноним (54), 16:23, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > "Так с браузера денег не заработаешь"

    Скажи это Google и его Chromium

     
     
  • 4.58, Аноним (58), 19:34, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А ветер дует потому что деревья раскачиваются.
     

  • 1.16, Аноним (16), 05:51, 25/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Удивительно, что набор белорусского больше русского.
     
     
  • 2.17, DESKTOP3HBS8ID (?), 07:53, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Это немного говорит о желании людей в среднем бесплатно помочь хорошему делу.
     
     
  • 3.18, Аноним (18), 08:01, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Такой большой отрыв говорит что этот коммон войс кому-то в Беларуси так сильно понадобился, что этот кто-то, возможно, и заплатил паре тысяч прохожих за запись пары фраз.
     
     
  • 4.21, Bob (??), 09:23, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    и то, что, например, русскоязычному сообществу просто насрать. Сколько всего носителей языка? данных собрали на 5 часов, за год)
    p.s.: до известных событий в РБ беларуский норм так продвигался даже государственно. Змагары грантов просто кучу втащили - как варик их освоить донатом голоса (такие огромные цифры уже давно, из года в год только мелочь обновляют, в плане часов - 9 за год прошлый). Но и в принципе коммюнити норм язык тащит у них.
     
     
  • 5.24, Аноним (4), 09:59, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Двигать чиновники могут что угодно. Никакого результата у них не будет.
     
  • 5.42, Аноним (42), 21:30, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Или о том, что для русского языка есть доступные средства распознавания и озвучки, которые в целом потенциальных пользователей устраивают, и ни кто не заинтересован использовать (и тренировать) еще и эту штуку. А просто энтузиастов в большом количестве просто побубнеть туда just for fun, не нашлось.
     
     
  • 6.46, Вы забыли заполнить поле Name (?), 00:13, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > что для русского языка есть доступные средства распознавания и озвучки

    Пример можно?

     
     
  • 7.48, Аноним (48), 02:19, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Озвучки - RHVoice. Там даже модель голоса одного типа есть, который в ролике, продвигающем явку на одно "всенародное голосование", замечен был.
     
  • 4.33, 12yoexpert (ok), 18:26, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    это не так, у белорусов никуда не пропадало национальное самосознание, вот и всё
     
  • 4.51, Аноним (51), 13:24, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > коммон войс кому-то в Беларуси так сильно понадобился

    И вот именно на белорусском языке, да? Сомнительно.
    Думаю дело в том, что белорусы спасают свой язык как могут вопреки действиям государства.

     
  • 4.64, Аноним (64), 17:22, 27/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Такой большой отрыв говорит что этот коммон войс кому-то в Беларуси так сильно понадобился, что этот кто-то, возможно, и заплатил паре тысяч прохожих за запись пары фраз.

    ^^^ - это вы только что прочитали конспиролохическую теорию про капитализмо-рептилоидов.

    Правда: в своё время о проекте написал новость самый большой технический (на тот момент) ресурс страны (второй по посещаемости белорусский сайт опять же на тот момент). Новость подхватили местные паблики и сайты и призвали своих юзеров "а давайте ухнем! (кому не лень потратить полчасика в день)". Комьюнити белорусское довольно активное ("спасибо" государству всячески мешающему, потому "превозмогать" и так приходилось постоянно) и активно взялось за дело.
    Вот собственно и всё.

     
  • 2.27, Хухрымухры (ok), 12:45, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Возьми и запиши хотя бы 10 фраз.

    Там кстати женских фраз мало.

     
  • 2.31, tim2k (ok), 18:20, 25/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Башкирский язык посмотри ещё - вот где удивительно.
     
  • 2.53, Antonym (?), 13:35, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Я из Беларуси и сам был удивлён подобным соотношением белорусского к русскому и украинскому.
    Если не изменяет память была какая-то общественная инициатива которая призывала потратить несколько минут на это дело, возможно она широко разошлась.
     
     
  • 3.61, Аноним (60), 21:54, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну что вы, какая инициатива. Это не наш путь. Главное, это духовность, скрепность и "национальное самосознание"(тм).
     

  • 1.28, Golangdev (?), 13:06, 25/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Я лично разочарован неоптимизированной главной страницей https://commonvoice.mozilla.org
    в которой вкрутили лагающую анимацию на hover по Speak или Listen.

    Лучше бы не вкручивали.

     
     
  • 2.45, Вы забыли заполнить поле Name (?), 00:07, 26/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Почему она лагает?
     
     
  • 3.65, Аноним (65), 05:59, 28/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Браузер хреновый. У тебя FireFox?
     

  • 1.44, Вы забыли заполнить поле Name (?), 00:07, 26/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Цель проекта хорошая, поддерживаю.
     
  • 1.47, чатжпт (?), 00:16, 26/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Немного задонатил голоса, но тексты мягко говоря странные в 90% случаев.
     
     
  • 2.63, Менаджер FF (?), 09:37, 27/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Спасибо, сейчас кофе на них куплю и задонячу в другие проекты.
     

  • 1.57, Аноним (54), 16:25, 26/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Занимаются как обычно чему угодно, но только не браузером!
     
  • 1.66, Аноним (65), 05:59, 28/12/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    На выходе то что будет какой-то машинный сет для обучения или сразу библиотека?
     
     
  • 2.67, Анонововвлвлвл (?), 09:19, 29/12/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Набор мп3. Чем новости читаешь?
    Библиотеку сам делай.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру