KotibAI — o‘zbek tilidagi ovozli xabarlarni matnga o‘giruvchi, sun’iy intellekt asosida bir qator funksiyalarni amalga oshiruvchi ekotizim. Uning asoschilari — Hikmatilla Ubaydullaev, Samandar Tursunaliyev va Firuzxan Yakubxodjayev.

Loyiha dastlab oddiy bot sifatida ish boshlagan: u turli ovozli xabarlarni matnga o‘girib, natijani mijozlarga Excel shaklida taqdim etardi. Vaqt o‘tishi bilan bu xizmatga talab ortib, loyiha bosqichma-bosqich kengayib bordi.

Bugungi kunda KotibAI faqat ovozni matnga aylantirish bilan cheklanmaydi. Tizim qo‘ng‘iroqlarni tahlil qilish, ma’lumotlarni tasniflash va ayrim biznes jarayonlarini avtomatlashtirish kabi funksiyalarni ham taklif etadi. Uning xizmatlaridan EVOS, Oqtepa Lavash, Turon Telecom va Murad Buildings kabi kompaniyalar foydalanmoqda.

Spot KotibAI hammuassisi Samandar bilan suhbatlashdi. U loyiha qanday shakllangani, kompaniyalar sun’iy intellekt texnologiyalarini qanday qabul qilayotgani hamda bu yechimlar biznes jarayonlariga qanday ta’sir ko‘rsatayotgani haqida so‘zlab berdi.

Intervyuning to‘liq versiyasi video-shaklda taqdim etilgan:


KotibAI ning birinchi mijozi qaysi kompaniya bo‘lgan? Qachon loyihani yanada rivojlantirish kerak degan xulosaga kelgansizlar?

Dastlab ishni oddiy bot sifatida boshlaganmiz. Birinchi mijozimiz Zoodmall bo‘lgan. Ular call-markazdagi suhbatlarni tahlil qilishda yordam so‘rashgandi. Biz qo‘ng‘iroqlarni ovozdan matnga o‘tkazib, transkripsiya tayyorladik va baholash tizimi orqali tahlil natijalarini taqdim etdik. Xizmatimiz ularga ma’qul kelib, pulli hamkorlik yo‘lga qo‘yildi.

Bu jarayon bizga bu yechim faqat bitta kompaniya uchun emas, boshqa bizneslar uchun ham foydali bo‘lishi mumkinligini ko‘rsatdi. Shundan so‘ng mahsulotni rivojlantirish ustida jiddiyroq ishlashni boshladik.

Bu orada Akmal Payziyev bilan hamkorlikda dorixonalardagi suhbatlarni tahlil qilish g‘oyasi ustida ham ishladik. Biroq keyinchalik Akmal aka Amerikaga ketishlariga to‘g‘ri keldi. Loyiha ustidagi ishlarni menga topshirib, o‘zlari maslahat berib turadigan bo‘ldilar. Shu jarayonda bir nechta savollar paydo bo‘ldi: dorixonalarda suhbatlarni yozib olishga qonunchilik qanday qaraydi, dorixona egalari bunga qanchalik rozi bo‘ladi? Shu sababli e’tiborni dorixonalardan ko‘ra call-markazlarga qaratishga qaror qildim. Natijada Kotib Analytics paydo bo‘ldi.

Agar hozir “Kotib kim?” deb so‘rasangiz, u endi oddiy bot emas. Hozirda O‘zbekistonda 60 dan ortiq kompaniya xizmatimizdan foydalanadi va dastlabki bot asosida butun bir ekotizim shakllandi.

Hozir platformada sakkizta AI xodim mavjud. Ular turli kompaniyalarda aniq vazifalarni bajarib, xodimlarga yordam beradi. Masalan, Evos yoki Murad Buildings’ga qo‘ng‘iroq qilganingizda, suhbatni tahlil qilayotgan tizimlar orasida bizning AI yechimlarimiz ham bo‘lishi mumkin.

Tizim bir sutkada necha soatlik audio-faylni qayta ishlay oladi?

Hozirda tizimimizda ishlayotgan GPU'lar ancha tez. Masalan, bitta GPU kartasi bir daqiqada taxminan 62 daqiqalik audio yozuvni transkripsiya qila oladi. Albatta, transkripsiyadan keyin qo‘ng‘iroqlarni tahlil qilish uchun ham qo‘shimcha vaqt talab etiladi.

Bugungi kunda platformaga kuniga 5000 dan ortiq qo‘ng‘iroq kelib tushadi. Har bir qo‘ng‘iroq o‘rtacha 2−3 daqiqa davom etadi. Bu kuniga qariyb 12 ming daqiqa, ya’ni taxminan 200 soat audio-yozuv degani. Tizim esa hozirgi quvvat bilan bir sutkada 5000 soatgacha audio yozuvni qayta ishlash imkoniyatiga ega.

Bugungi kunda Kotib AI jamoasida kimlar faoliyat yuritmoqda?

Jamoamizning asosiy qismini dasturchilar — backend va frontend developerlar tashkil etadi. Shuningdek, qo‘ng‘iroqlar tahlili yo‘nalishida ilgari TBC’da ishlagan mutaxassis ham bor.

Operatsion direktorimiz esa avval Rossiyadagi Skillbox kompaniyasida faoliyat yuritgan. Yaqinda mijozlarni qo‘llab-quvvatlash va koordinatsiya yo‘nalishini kuchaytirish maqsadida Uzum’dan yangi mutaxassis ham jamoaga qo‘shilmoqda.

Umuman olganda, bugungi kunda Kotib ekotizimi doirasida 30 nafardan ortiq dasturchi faoliyat yuritmoqda. Operatsion jamoamiz esa 8 kishidan iborat.

kotibai, samandar tursunaliyev

Foto: Spot

Xodimlarni ishga olishda nimalarga e’tibor berasiz? Jamoani shakllantirishda xatoga yo‘l qo‘yganmisiz?

Suhbat orqali xodimni baholamayman. 30 daqiqalik intervyu davomida odamning haqiqiy qobiliyati va ishga yondashuvini to‘liq tushunib bo‘lmaydi — u xohlagan gapini aytishi mumkin. Rezyumega ham to‘liq ishonmayman, uni hatto GPT yozib berishi mumkin.

Shuning uchun biz ko‘proq amaliy yondashuvdan foydalanamiz. Mavjud xodimlar o‘zlari tanigan, natija ko‘rsatgan yoki yangilik qilmoqchi bo‘lgan odamlarni tavsiya qiladi. Yangi kelgan xodim ikki haftalik test davridan o‘tadi: haqiqiy ish jarayonida ishlaydi, natijasi kuzatiladi. Agar u bu vaqt ichida ma’qul natija ko‘rsatsa, kompaniyada qoladi.

Jamoani shakllantirishda qilgan xatolarimdan biri — aqlli odamni avtomatik ravishda yaxshi xodim deb o‘ylash. Bir necha marta juda aqlli ko‘ringan yosh mutaxassislarni ishga olganman. Ularning bilim darajasi yuqori bo‘lgan, lekin mas’uliyat hissi yetarli bo‘lmagan.

Masalan, vazifani boshidan oxirigacha yetkazish jarayonida fokusini yo‘qotib, boshqa narsalarga chalg‘ib ketishgan. Shunda faqat aqlning o‘zi yetarli emasligini tushundim. Xodim eng aqlli bo‘lishi mumkin, lekin natija chiqarish uchun mas’uliyat, intizom va vazifani oxirigacha yetkazish qobiliyati birinchi o‘rinda turadi.

Samandar, o‘zi nima sababdan aynan sun’iy intellektga doir startap tanlaganingiz haqida gapirib bersangiz.

Sun’iy intellekt hayotni yaxshilashga kuchli yechim berishi mumkinligini ko‘rib, shu yo‘nalishni tanladim. Startapni muammoni yangi va samarali usulda hal qilish imkoniyati deb tushunaman.

Masalan, Evos qornim och bo‘lsa, bu muammoni hal qiladi, keyin boshqa startap esa shu vazifani tezroq va sifatliroq bajaradi. Shu tajriba shuni ko‘rsatdiki, startap faqat mashhurligi bilan emas, odamlarning hayotini yaxshilashi bilan muvaffaqiyatga erishadi. Shu sababli sun’iy intellekt asosida startap yaratishga qaror qildim.

30 dan ortiq mutaxassisni jamlagan KotibAI’ni yaratishga nima sabab bo‘lgan?

O‘sha paytlarda Hikmat akam (Spot izohi — Hikmatilla Ubaydullaev) Prezident administratsiyasida ishlagan. U yerda shunday vaziyat bo‘lgan: davlat rahbari nutq so‘zlaganidan keyin har bir gapini matnga o‘tkazish kerak edi. Tasavvur qiling, ikki soatlik ma’ruza yoki suhbatni qo‘lda matnga aylantirish juda katta mehnat talab qilardi.

Shunda biz o‘yladik: “Agar bu jarayonda sun’iy intellekt yechim bera olsa-chi?” Masalan, jurnalistlar bir soatlik intervyuni matnga o‘tkazish uchun uch soat vaqt sarflagan. Bizning birinchi maqsadimiz bu vaqtni uch soat emas, uch daqiqaga qisqartirish edi.

Birinchi versiyada xatolar ko‘p bo‘lgan, shuning uchun tizim ustida qayta ishlash kerak bo‘ldi. Keyingi bosqichda uch soatlik ish bir soatga qisqardi. Hozirgi versiyada esa audio yuklansa, uch daqiqa ichida 95% va undan yuqori aniqlik bilan matn tayyorlanadi.

Birinchi prototip haqida gapirib bersangiz, u qanday bo‘lgan?

KotibAI’ning birinchi prototipi juda sodda va sifatsiz bo‘lgan. Masalan, suhbatni tizimga yuklasangiz, ba’zi so‘zlar almashib ketar, transkripsiya sifati past bo‘lgan.

Sun’iy intellektni shunday tushunish kerak: uni qancha ko‘p o‘rgatsangiz va ustida ishlasangiz, shuncha aqllilashadi. Birinchi versiyada yetarlicha e’tibor bermaganimiz uchun natija qoniqarli bo‘lmagan. U bozorda ishlatilgan bo‘lsa-da, hali ko‘p xatolar mavjud edi.

kotibai, samandar tursunaliyev

Foto: Spot

Dastlab eng katta qiyinchiliklardan biri shevalar edi. Masalan, vohaliklar yuborgan ovozli xabarlarni to‘g‘ri transkripsiya qilish deyarli imkonsiz bo‘lardi. Keyin qo‘qonliklar va boshqa hududlardagi shevalar ham alohida muammo tug‘dirdi.

Hatto shunday vaziyatlar bo‘ldiki, men o‘zim ham audioni eshitib, uni matnga to‘liq o‘tkaza olmaganman. O‘zbekistonda shevalar juda xilma-xil va ba’zi so‘zlar turli hududlarda butunlay boshqacha talaffuz qilinadi. Shu sababli har bir sheva ustida alohida ishlashni boshladik.

Boshlanishida qancha mablag‘ ajratgansizlar?

Ovozni matnga o‘girish imkonini beradigan botni ishlab chiqish uchun dastlab taxminan $300 sarflaganmiz. Keyinchalik qo‘shimcha mablag‘ kiritib, Kotib Analytics’ni rivojlantirish uchun $20 ming atrofida investitsiya qilganmiz.

Hozirgi tushumlar loyihaning o‘ziga qayta investitsiya qilinadimi?

Dekabr oyida nihoyat tushumlarimiz o‘z xarajatlarini qoplashni boshladi. Shu vaqtdan boshlab foydaga ham chiqa boshladik: qo‘shimcha xona oldik va hozir marketing bo‘yicha xodim qidiryapmiz. Ya’ni kelgan pul darhol o‘z joyini topib, loyihani rivojlantirishga sarflanmoqda.

Startapdan aslida hech qachon darhol foyda kutilmaydi. Agar siz hozir foyda olayotgan bo‘lsangiz, demak pulni marketingga, mijozlarni ko‘paytirishga yoki mahsulotni yaxshilashga sarflamayapsiz. Startapning haqiqiy daromadi esa sotib olingan paytda keladi — masalan, TBC Bank Group O‘zbekistondagi BILLZ’ni sotib olgani singari. Shu sababli startap keltirayotgan foyda na sheriklar, na investorlar uchun qiziq emas, u butunlay o‘sish va rivojlanishga qayta investitsiya qilinadi.

Bugun Kotib AI nimaga asoslangan? O‘zining shaxsiy modellarigami yoki tayyor yechimlardan foydalanadimi?

Biz o‘zimizning shaxsiy modelimizni yaratdik. Lekin ochiq aytishim kerak, O‘zbekistonda hech kim modelni butunlay noldan yaratmaydi. Ilm-fanda har bir natija oldingi olimlarning ishlari ustiga qo‘shilib boradi.

Shu sababli bozordagi eng yaxshi open-source modellarni oldik: oldik — masalan, OpenAI yoki boshqa yirik kompaniyalar ishlab chiqqan modellardan. Ularning asosiy kamchiligi esa o‘zbek tilini yetarlicha bilmasligida edi. Shuning uchun biz ularni qayta o‘qitib, o‘zbek tiliga moslashtirdik. Natijada hozir qo‘limizda o‘zimizning modellarimiz mavjud: ovozni matnga o‘tkazish modeli, LLM va boshqa yechimlar.

Texnologiyalarni o‘zbek tiliga o‘qitish qanchalik murakkab?

Sun’iy intellektni o‘qitishda eng muhim narsa — dataset. Masalan, bizda 3000 soatlik audio bor edi. Agar faqat men gapirgan material yoki YouTube’dagi podkast va intervyularni ishlatganimizda, model yaxshi transkriptsiya qilardi, lekin shevalarni tushunmas edi. Shu sababli o‘zbek tilidagi turli shevalarni ham qamrab olgan ma’lumotlar ustida ishlashimiz kerak bo‘ldi.

kotibai, samandar tursunaliyev

Aqlli AI diktofon. Foto: Spot

Biz 3000 soatlik audioni hududlarga bo‘ldik: bir qismi vohaga, bir qismi vodiyga, yana bir qismi Xorazmga tegishli edi. Hatto vodiy ichida ham farqlar mavjud: Oltiariqda “kiyapti”, “oyapti” ishlatilsa, Qo‘qonda “balla” deyiladi. Shu farqlarni alohida ajratib, qo‘lda yozib chiqib dataset tayyorladik.

Keyin bozordagi open-source modelni olib, ushbu dataset bilan qayta o‘qitdik. Natijada o‘zbek tilini va turli shevalarni yaxshi tushunadigan modelga ega bo‘ldik.

O‘zbek tili juda boy. Masalan, “qovun tushirmoq” iborasini AI qanday tushunadi?

Sun’iy intellekt uchun so‘zning ma’nosi matematik koordinatsiya sifatida tasavvur qilinadi. “Qovun tushirmoq” iborasi aslida “ish o‘xshamay qoldi” degan ma’noni bildiradi, lekin AI uni to‘g‘ridan-to‘g‘ri qovunni qo‘ldan tushirib yuborish sifatida ham qabul qilishi mumkin.

Model har bir so‘z va iboraning o‘z “koordinatsiyasi"ni xonadagi nuqta sifatida tasavvur qiladi. Masalan, “gul” bir joyda, “atirgul” unga yaqin, “Toshkent” esa boshqa joyda joylashadi. Iboralar ham ishlatilgan kontekstga qarab boshqa so‘zlar bilan bog‘lanadi va o‘z koordinatsiyasini hosil qiladi. Shu tarzda, agar “qovun tushirdi” negativ kontekstda ishlatilsa, model uni “ish o‘xshamadi” ma’nosida tushunadi.

Shuning uchun o‘zbek tilidagi mavjud kontekstlarni, jumladan Instagram’dagi izohlar va turli suhbatlarni modelni o‘qitishda ishlatdik.

Model juda ishonchli ko‘ringan, lekin noto‘g‘ri xulosa chiqargan holatlar ham bo‘lganmi?

Bo‘ladi, chunki baholash baribir subyektiv. Agar instruksiya to‘g‘ri berilmagan bo‘lsa, model noto‘g‘ri xulosa chiqarishi mumkin.

Masalan, kompaniya logikasiga ko‘ra, agar mijoz boshqa filialga yo‘naltirilsa, yozuvni o‘sha filial olishi kerak edi. Ko‘rsatmada bu holat qayd etilmagani uchun model xato chiqardi. Keyin ko‘rsatmaga qo‘shimcha shart qo‘shilgach, baholash to‘g‘rilandi.

Foizlarda aytganda, bunday xatolik 100 ta qo‘ng‘iroqdan taxminan 3−5 tasida uchraydi. Agar ko‘rsatma to‘g‘ri yozilgan bo‘lsa, xatolik deyarli uchramaydi. Shu sababli umumiy holatda bu xatoliklar tizim ishlashiga katta ta’sir qilmaydi.

Maʼlumotlar xavfsizligi masalalarini qanday hal qilasizlar?

Ma’lumotlar xavfsizligi biz uchun birinchi o‘rinda turadi. Serverlarimiz O‘zbekistonda joylashgan va o‘z modellarimiz ishlatilganligi sababli barcha ma’lumotlar o‘zimizning serverlarda saqlanadi.

Bu, shuningdek, bizning nomimiz va obro‘miz masalasi. Agar “biror kompaniyaning ma’lumotlari bizdan chiqib ketdi” degan maqola paydo bo‘lsa, bu biz uchun deyarli do‘konni yopish bilan barobar.

Texnik jihatlarni, qaysi tizimlar bilan himoya qilayotganimizni injenerlarimiz batafsil tushuntira oladi. Lekin aytishim mumkinki, biz kiberxavfsizlik bo‘yicha eng yaxshi mutaxassislarni jalb qilganmiz va himoya qatlamlarini maksimal darajada yopganmiz.

Xalqaro nutq tahlili yechimlaridan asosiy farqingiz nimada?

Asosiy farqimiz shundaki, texnologiya bugungi kunda katta muammo emas. Open-source yechimlar ko‘paydi, dasturchilar esa avvalgidan 5−10 baravar tez ishlayapti. Masalan, komandamga bir yil oldingi vazifani bersam, hozir uni kamida besh baravar tez bajaradi.

Demak, texnologiya nuqtayi nazaridan biz ham boshqa yirik kompaniyalar — OpenAI, Anthropic, Jax va Cloud bilan bir darajaga yetib kelganmiz. Oddiy foydalanuvchi uchun esa ularning farqi sezilmaydi. Ovozni matnga o‘tkazish texnologiyamiz ham shu darajaga yetdi: xatoliklar deyarli natijaga ta’sir qilmaydi.

kotibai, samandar tursunaliyev

Foto: Spot

Hozir asosiy bosqich — tahlil va distribyutsiya. Qo‘ng‘iroqlarni tahlil qilish metodikasi ham hal qilingan. Startap sifatida biz uchun eng muhim masala yechimni tez va samarali tarqatish, ma’lumotlarni yig‘ish va ularni ko‘paytirishdir.

Chet eldagi, masalan, Rossiya yoki Amerika kompaniyalarini o‘rganib chiqdik. Texnik jihatdan ulardan ortda qolmaymiz, lekin distribyutsiya nuqtasida O‘zbekiston bozorida ustunlikka egamiz, chunki ular bu bozorga hali kirib kelmagan.

Markaziy Osiyodan tashqari, qaysi bozorlarga chiqishni rejalashtiryapsiz?

Sababi, u yerda yaqin tanishlarim bor va ular bozorga kirishimizga yordam berishadi. Agar bu bozorda 5−6 ta kompaniyaga xizmatimizni taqdim etsak, yechimni o‘rnatib, natijalarni ko‘rsatamiz. Shu orqali qolgan kompaniyalar ham bunga ergashadi. Shundan so‘ng navbat AQSHga keladi. Amerikada ham ko‘plab o‘zbeklar bor, masalan, Akmal Payziyev, Super Dispatch’da Bek Abdullayev.

Kuchimizni faqat tanishlarga bog‘lamaymiz. Lekin birinchi qadamni qo‘yishda tanishlar orqali kirish oson bo‘lsa, nega qiyin yo‘lni tanlash kerak? Oson yo‘lni tanlab, tezroq natija olish — bizning strategiyamiz.

Oxirgi savolim, besh yildan keyin Kotib AI insonlar hayotida qanday rol o‘ynaydi deb o‘ylaysiz?

Menimcha, besh yildan keyin ham kompaniyalarda odam ishlashda davom etadi. Tizim shunday: odamlar baribir odam bilan ishlashni xohlashadi va mas’uliyatni kimdirdan talab qilish kerak bo‘ladi. Masalan, sifat nazoratchisi bo‘lsam, mening mas’uliyatim bor. KotibAI analitikasi zo‘r ishlashi mumkin, lekin SIga hali mas’uliyat yuklash darajasi yetmagan.

Besh yildan keyin biz xalqaro maydonga chiqamiz. Eng muhim narsa — mahsulotimiz qolishi va kuchli jamoa shakllanishi. Hozirgi jamoam bilan faxrlanaman; kelajakda 50 kishilik kichikroq, lekin ishtiyoqi baland va noodatiy muammolarni ko‘ra oladigan jamoa bo‘lishini xohlayman.

KotibAI esa O‘zbekistonda va chet eldagi ko‘plab korporatsiyalarda xodimlarning yordamchisi sifatida ishlaydi — go‘yo har bir xodimning yonida turadigan hamroh singari. Masalan, jurnalist intervyu olayotganda KotibAI yozib boradi, tutilib qolgan joylarni avtomatik tahrir qiladi va foydalanuvchining ritmini o‘rganib, unga moslab matnni tayyorlaydi.

Shunday qilib, KotibAI xodimlarni “upgrade” qiladi: har bir xodim ko‘proq va sifatli ishlarni amalga oshiradi. Bu esa bizning kelajakdagi rolimiz bo‘ladi.