ПРООН на базе Mozilla Common Voice запускает инициативу UzbekVoice.ai — открытую базу узбекской речи, используемую для машинного обучения. Об этом Spot сообщила пресс-служба ПРООН.

В сообщении отмечается нехватка голосовых данных на узбекском языке, которая мешает развитию локальных стартапов и инновационных проектов. Данная инициатива призвана решить эту проблему и сделать технологии распознавания голоса доступными для узбекистанского бизнеса.

Пользователи, говорящие по-узбекски, приглашаются к участию в UzbekVoice.ai — для этого нужно отправить свой голос в языковую базу. Она будет использоваться, чтобы научить алгоритмы ИИ понимать узбекскую речь и расширить его применение.

Участники могут как зачитывать предложения на узбекском языке, так и прослушивать их для оценки правильности перевода. Это поможет ИИ распознавать разные акценты языка.

Для участия в инициативе требуется:

  • перейти на сайт Mozilla Common Voice (можно также зарегистрироваться, но это необязательно);
  • нажать «O'qish» (Прочитать) или «Tinglash» (Прослушать)
  • для выбравших «O'qish» — зачитывать представленные предложения на узбекском языке;
  • для выбравших «Tinglash» — слушать предложения и проверять их правильность.

Пользовательские записи будут доступны публично, однако можно скрыть своё имя.

Наиболее активные слушатели и читатели UzbekVoice.ai получат ценные призы. Для трёх пользователей в каждой категории предусмотрены HDD, смарт-часы или внешняя батарея (powerbank). Награждение состоится 10 декабря.

Сбор данных осуществляется в рамках совместного с Мининфокомом проекта цифровой трансформации Узбекистана. Подробная информация доступна на сайте UzbekVoice.ai.

База голосовых данных будет публичной и каждый разработчик сможет использовать ее бесплатно, интегрировав голосового помощника на узбекском языке в свои проекты.

Ранее Spot сообщал, что в Узбекистане создадут особые условия для проектов в сфере ИИ.