Казахстанский стартап Cybernet AI представил первую масштабную модель автоматического распознавания речи (ASR) для тюркских языков. Об этом сообщило Министерство искусственного интеллекта и цифрового развития Казахстана.
Новая разработка стала крупнейшим проектом подобного рода в Центральной Азии, а также первой ИИ-моделью, спроектированной изначально под специфику тюркских языков. Стратегическую поддержку при создании модели ASR оказывал центр Astana Hub.
По словам разработчиков, модель обучена на казахском, турецком, узбекском, кыргызском, азербайджанском и татарском языках. Также она способна корректно распознавать смешанную тюркско-русскую разговорную речь.
«Мы сознательно отказались от адаптации англоязычных моделей и создали ASR-модель, которая изначально понимает живые, смешанные формы разговорного языка. Это делает разработку не просто очередным технологическим продуктом, а вкладом в формирование локальной экосистемы искусственного интеллекта и технологического суверенитета Казахстана», — заявил технический директор Cybernet AI Рашид Исмаилов.
Новая ASR-модель ориентирована на бизнес, который работает с большими объемами голосовых коммуникаций. Речь идет о банках и финансовых организациях, телеком-операторах, контакт-центрах, логистических и сервисных компаниях, а также о сфере госуслуг.
До создания новой модели Казахстан и другие страны региона были вынуждены использовать международные ASR-модели, ориентированные в первую очередь на английский язык. Подобные решения слабо учитывают тюркскую фонетику и акценты, а также смешанную речь, отмечают в МИИРК.
Как отмечают в Cybernet AI, новая модель устойчива к шумам, акцентам и переключению языков в одном предложении. Ожидается, что она позволит снизить расходы на поддержку клиентов и обеспечить круглосуточную доступность голосового сервиса.
Ранее Spot сообщал, что OpenAI запустила собственный онлайн-переводчик ChatGPT Translate.
