Toshkentdagi “Inha” universitetining uch nafar talabasidan iborat “Tahrirchi” jamoasi ikki yildan ortiq vaqt davomida o‘z loyihasida IT va o‘zbek tiliga bo‘lgan muhabbatni uyg‘unlashtirib, savodxonlik va tilga hurmatni targ‘ib qilmoqda.

Bugungi kunda startap imlo tekshiruvi, kirilldan lotinga va lotindan kirillga transliteratsiya kabi mahsulotlarga ega ekotizimdir.

Jamoa 2022-yil “mGovAward2022” tanlovida g‘olib chiqdi va loyiha rivoji uchun $50 mingni qo‘lga kiritdi. Hozirda “Tahrirchi” o‘z kelajagi uchun yangi moliya manbalarini izlamoqda. Rejalarda, jumladan, o‘zbek tilida matn hosil qila oladigan til modelini yaratish ham bor.

“Spot” loyiha asoschisi Muhammadsaid Mamasaidov bilan startap g‘oyasi qanday paydo bo‘lgani, dasturchilar duch kelgan qiyinchiliklar va loyiha kelajagi haqida suhbatlashdi.


Mening otam dasturchi, shuning uchun bolaligimdan kompyuterlar qurshovida katta bo‘ldim. O‘smirlik chog‘imda veb-saytlarda ishlash bilan o‘zimni IT-sohasida sinab ko‘rishni boshladim.

To‘g‘ri, o‘shanda qisqa vaqt davomida shifokor bo‘lmoqchi bo‘ldim, lekin oxir-oqibat axborot texnologiyalari yo‘nalishini tanladim. Avvaliga Toshkent axborot texnologiyalari texnikumiga, keyin esa Toshkentdagi “Inha” universitetiga o‘qishga kirdim.

“Ma'lumotlar tuzilishi” fanining ikkinchi yilida bizga tanlov asosida vazifasi yuklatildi. Men o‘zbek tilidagi matnning imlosini tekshirish bo‘yicha loyiha ustida ishlashga qaror qildim. Jarayonda ma’lum bo‘ldiki, bu juda qiyin ish ekan. Bir amallab topshirdik, o‘qituvchi ham natijalardan mamnun bo‘lmadi. O‘shanda hammasi asosiy shaklda edi.

Biz o‘zbek tili qanday ishlashini tushunmas, bizni ko‘proq texnik tomoni qiziqtirardi. To‘g‘risini aytsam, o‘shanda men o‘z tilimni tanlangan loyiha uchun talab qilinadigan darajada bilmasdim. Ish jarayonida esa unga oshiq bo‘lib qoldim.

Loyihani topshirgach, u haqidagi fikrlar miyamdan ketmadi, menimcha, bu g‘oyani yuqori saviyada amalga oshirishni xohlaganim bilan bog‘liq. Shunday qilib, tadqiqot davom etdi va birinchi natijalarga olib keldi. Bizning tilimiz imlo tekshirish jihatidan boshqalardan farq qiladi.

Men shunga o‘xshash modellarni faqat fin-ugor va turkiy til oilalarida uchratdim. Bundan biz o‘zbek tiliga oid muhim jihatni olib chiqdik, bu biz ishlab chiqqan texnologiya asosiga aylangan, ya’ni nutq va yozishda juda uzun so‘zlarni hosil qilamiz. Masalan, ba’zilari boshqa tillarga tarjima qilinganda butun jumlalarni anglatishi mumkin.

O‘zbek tilining so‘z yasalishi boshqacha — bizda 200 ga yaqin affiks (affiks — soʻzning qismi. Oʻzakka zid qoʻyiladigan, soʻz yasalishi yoki grammatik ifoda shakllanishiga xizmat qiladigan morfema — “Spot” izohi) mavjud. Va jamoaning vazifasi har bir bunday morfema uchun qoida belgilash edi — qaysi affiks qaysidan keyin keladi, so‘zning ma’nosiga qanday ta’sir qiladi va hokazo.

Faqat bu qismni ishlab chiqish uchun tilshunoslarning ikki yoki uch oylik mashaqqatli mehnati talab qilinadi. Tizim o‘zbekcha bo‘lmagan barcha so‘zlarni rad qilishi kerak.

o'zbek tili, tahrirchi, til

Dastlabki variant ustida til bo‘yicha bilimimga tayanib o‘zim ishladim. U paytda tilshunoslarning alohida jamoasi uchun mablag‘ yo‘q edi. Shu o‘rinda men ish davomida duch kelgan yana bir qiyinchilik — o‘zbek tili bo‘yicha to‘laqonli lug‘atlarining elektron shaklda yo‘qligiga e’tibor qarataman.

Qog‘oz variant va skanerlanganlari bor, lekin ular bizning maqsadlarimizga mos kelmasdi. Shuningdek, so‘z turkumlari lug‘atlarda ko‘rsatilmagan. Asosni shakllantirishda bu muhim edi, chunki nutqning har bir qismi o‘ziga xos so‘z yasalish qoidalariga ega.

Birinchi sarmoya

“Tahrirchi"ning birinchi varianti shaxsiy mablag‘larimiz hisobidan tayyorlanganmiz. Keyin moliyalashtirishni qidira boshladik. Masalan, Innovatsion rivojlanish vazirligidan (hozirda agentlik — “Spot” izohi) sarmoya jalb qilishga urinib ko‘rdilar, ammo natija bo‘lmadi.

Biroz o‘tgach, mobil ilovalar uchun “mGovAward2022” tanloviga duch keldim. Bizning yechimimiz mos keladi deb qaror qildik. G‘oyalar ko‘p emasdi, ulardan biri Android uchun o‘zbek tilida imloni tekshirish uchun bepul dasturiy ta’minot klaviaturasi edi. Ishlanmamiz afzalligi kengaytmaning kichik vazni bo‘lib, u atigi ikki megabayt’ni tashkil qilardi.

O‘shanda uch kishilik jamoa yig‘ildi — men, data scientist va dizayner, hozir ham shu tarkib bilan “Tahrirchi” ustida ishlayapmiz. Musobaqa oldidan men modelni taxminan olti oy davomida ishlab chiqdim, klaviaturaning o‘zi uchun uch oy vaqt ketdi.

Albatta, biz bunday samaradorlikka erisha olmadik va jarayonlarni, masalan, “Yandex” klaviaturasini ishlab chiquvchilari kabi optimallashtirmadik. Bizning holatda, so‘zlarni avtotuzatish yo‘q bo‘lib, foydalanuvchi xabarda xatolik borligini faqat yozgandan keyin tushunardi. O‘sha paytda o‘zbek tilidagi so‘zlarga ko‘p sonli turli affikslar qo‘shilib to‘ldirilishi mumkin bo‘lgani uchun biz buni ta’minlay olmadik.

“Tahrirchi” loyihasi tanlovning ikkinchi bosqichiga, so‘ngra finalga o‘tib, g‘oliblikni qo‘lga kiritdi. Loyihani yanada rivojlantirish uchun berilgan mukofot jamg‘armasi $50 mingni tashkil etdi. O‘zbek tili mavzusiga e’tibor berilganidan xursand bo‘ldik.

Musobaqa natijasi keyingi rivojlanish uchun kuchli turtki bo‘ldi.

o'zbek tili, tahrirchi, til

“mGovAward2022” tanlovida taqdirlash marosimi. Fotо: Muhammadsaidning shaxsiy arxividan

Grant olganimizdan so‘ng veb-muharrir ustida ishlay boshladik. Mahsulotning butun murakkabligi uning lingvistik tomonida yotadi, deb tuyulishi mumkin, lekin aslida texnik nuqtai nazardan ham qiyinchiliklar bor edi. Shuning uchun biz tilshunoslar va IT-mutaxassislaridan iborat ikki jamoa tuzdik.

O‘zbek tili bilan ishlash uchun yigit va qizlarni e’lon orqali topdik. Ishga kirishishdan oldin ular test topshirig‘ini topshirib, texnologiyamizni o‘rganishdi. Tanlangan annotatorlar affiks bazasini to‘ldirishdi, shu sabab bugungi kunda tizimimiz o‘zbek tilidagi deyarli barcha so‘zlarni taniydi. Bunga taxminan uch oy kerak bo‘ldi.

Keyin tilshunoslar jamoasi transliteratsiya ustida ishlay boshladi. Kirill alifbosidan lotin alifbosiga va aksincha belgilarni batafsil takrorlash tizimini yaratish biz uchun muhim edi. Hozirda jarayon tugallandi, model tayyor va imlo tekshiruvi shaklida taqdim etildi.

Bugungi kunda foydalanuvchimiz lotin yozuvidagi matnni xizmat oynasiga joylashtirishi, uni kirill alifbosiga o‘zgartirishi va aksincha amaliyotni amalga oshirishi mumkin.

o'zbek tili, tahrirchi, til

“Tahrirchi” veb-saytida transliteratsiya va imlo tekshiruvi

“Microsoft"ga integratsiya

Shuningdek, biz “Microsoft Word” uchun kengaytmani ishlab chiqdik, uni bugun yuklab olish va o‘rnatish mumkin.

“Microsoft” men duch kelgan eng byurokratik kompaniya (kuladi). Muloqot qilish qiyin bo‘ldi. Biz “Microsoft Word” uchun kengaytmamizni tayyorlash uchun kerakli hujjatlarni topdik, kompaniya marketpleysida chiqarish uchun hamma narsani tayyorladik.

Ammo keyin turli muammolar yuzaga kela boshladi — bizning funksiyalarimiz mahsulotning barcha versiyalarida ishlamadi. Men kodning qismlarini turli yo‘llar bilan qayta yozishim kerak edi.

Tashkilot bilan yozishmalar bir necha haftaga cho‘zilar, muammolar sekin hal qilinardi. Startap uchun bu imkonsiz shartlar. Ammo “Microsoft” baribir bizning kengaytmani marketpleysiga joylashtirdi.

o'zbek tili, tahrirchi, til

“Microsoft” uchun kengaytma

Muayyan chegaragacha foydalanuvchilar mahsulotlarimizdan bepul foydalanishlari mumkin.

“Microsoft Word” uchun kengaytmani o‘rnatishga bizning veb-saytimizda ro‘yxatdan o‘tish va ko‘rsatmalarga muvofiq bir necha qadamlarni bajarish kerak. Hozirda 150 ga yaqin kishi ishlanmadan foydalanmoqda. “

Microsoft"da muvaffaqiyatli tatbiq etilgandan so‘ng, men “Tahrirchi"ni ekotizim sifatida tanishtira boshladim. Endi har bir loyiha alohida e’tibor, yondashuv va targ‘ibotni talab qiladi.

Targ‘ib haqida gapiradigan bo‘lsak: biz hali marketing bilan shug‘ullanmayapmiz, chunki biz uchun startapni rivojlantirish uchun imkon qadar ko‘proq pul tejash muhim. Tanlovda g‘olib bo‘lishdan oldin loyihani targ‘ib qilish faol tarzda amalga oshirilgan. Jumladan, loyiha haqida Ma’naviyat.edu, til.gov.uz saytlari uchun nashrlar, “O‘zbekiston 24” va “Yoshlar” kanallarida reportajlar chop etildi.

Hozirgi holatga kelsak, men “biz raqobatchilardan nima bilan farq qilamiz?” degan savolga qisqa va aniq javob olmagunimizcha, reklama kampaniyalarini tashkil qilmaymiz, deb qaror qildim.

Raqobatchilar qatoriga “Savodxon” loyihasi — biz bilgan birinchi loyiha, shuningdek, “Matn.uz” — o‘zbek tiliga mos kelmaydigan texnologiyaga asoslangan bepul xizmat, “Matn.uz"ga o‘xshash “korrektor” va “YuridaORFO” — o‘ziga xos maxsus yechim bor.

Monetizatsiyaga kelsak, menimcha, oddiy imlo tekshiruvi va transliteratsiya bepul xizmat bo‘lishi kerak. Biroq, bizda hali ham 10 ming so‘z chegarasi bor, keyin pullik versiya boshlanadi, u ham so‘zlarning imlosini tekshirish uchun qo‘shimcha xizmatlarni taqdim etadi — birgalikda yoki alohida, apostrofli yoki apostrofsiz. Narxi oyiga 16 ming so‘mni tashkil qiladi. Keyinchalik murakkab g‘oyalarni amalga oshirganimizda, to‘liq pulli versiya paydo bo‘ladi.

Bizning mahsulotlarimizdan bugungi kunda bepul va pullik versiya mavjud bo‘lgan “Microsoft Word” uchun veb-muharrir va kengaytma mavjud. Oyiga 80−100 ga yaqin odam to‘laydi, umuman olganda kuniga 1000 ga yaqin kishi ishlanmadan foydalanadi.

Android uchun klaviatura, so’zlarni tekshirish (hatto juda uzunlarini)

Shuningdek, Adliya vazirligining hujjat aylanmasiga “Tahrirchi"ni kiritish ustida ishlayapmiz. Ularda biz ishlanmamizni birlashtiradigan ichki tizim mavjud. Hozir yakuniy bosqichdamiz, umid qilamanki, hamkorlik natijasida kelishuv bo‘ladi.

Birinchi oyda vazirlik kengaytmani bepul sinovdan o‘tkazadi, keyin oylik obuna formati ishlaydi. Hisob-kitoblar yukka — foydalanuvchilar soniga bog‘liq bo‘ladi. Masalan, 100 kishi uchun oyiga taxminan 500 ming so‘m to‘lanadi.

Rejalar

Biz faqat imloni tekshirishning o‘zi yetarli emasligini tushunamiz, shuning uchun parallel ravishda boshqa g‘oyalarni ishlab chiqmoqdamiz. Xullas, o‘zbekcha matnlarni bir korpusga jamlayapmiz. Turli materiallar, nashrlar va postlar to‘plami ma’lum vaqt oralig‘ida tilni to‘liq tasvirlay oladi. To‘plam davrlar bo‘yicha amalga oshiriladi, biz o‘tgan asrning 30-yillaridan boshladik.

Masalan, XX asrning 90-yillarida til qanday bo‘lganligi sizni qiziqtirsa, bizning tizimimiz bayon ohangini, o‘sha davrda tilning qo‘llanish o‘ziga xosliklarini ko‘rsatadi. Jamoa 40 mingga yaqin kitob to‘pladi — bu juda katta baza. Biz barcha materiallarni skanerdan o‘tkazdik va skanerlash paytida yuzaga kelgan xatolarni tuzatdik.

Bularning barchasi, ko‘pchilik taxmin qilganidek, neyrotarmoqni o‘rgatish uchun kerak. Yakunda biz nafaqat so‘zda harf yetishmayotganligini aytadigan, balki matndagi stilistik kamchiliklarni ham aniqlay oladigan universal modelni olishni xohlaymiz.

Biz “ChatGPT” bilan raqobat qilishni rejalashtirmayapmiz, lekin matn yaratish funksiyasi haqida o‘ylayapmiz. Matnlar bazasi tarjima tizimi uchun ham foydali bo‘ladi, bu yerda to‘plangan ma’lumotlar asosida xizmat imlo va stilistik jihatdan savodli matnni taqdim etadi. Hozirda u ham muhokama va rejalashtirish bosqichida.

Rejalarda o‘zbek tilini ommalashtirish va undan foydalanish sifatini oshirish bo‘yicha boshqa yechimlar ham mavjud. Ikki yil ichida biz o‘z tilimizga singib ketdik va ekotizimni rivojlantirishni davom ettirmoqchimiz — yuqori sifatli tarjimon va matn yaratish xizmatini ishlab chiqish. Va bunda turli sohalar uchun salohiyat mavjud — masalan, kopirayterlar uchun.

o'zbek tili, tahrirchi, til

“Tahrirchi” bizning asosiy va yagona ish joyimiz. Biz MChJ sifatida ro‘yxatdan o‘tganmiz va “IT Park"dagi rezidentligimiz tufayli daromad solig‘ini ikki baravar kam to‘laymiz. Darhaqiqat, biz “IT Park” tanlovidan keyin rivojlangan startapmiz.

Yaqin kelajakda biz grammatika tekshirgichni ishga tushirishni, shuningdek, o‘zbek tilidan foydalangan holda boshqa yechimlarni, masalan, chat-botini yaratishni rejalashtirmoqdamiz.

Bugun biz hamma narsani tejashga harakat qilmoqdamiz: grant mablag‘lari shu yil oxirigacha yetadi. Har qanday startap uchun sarmoyani jalb qilish har doim dolzarbdir. Buning uchun esa mavjud mahsulotlarni monetizatsiya qilish yo‘llarini ko‘rsatishimiz kerak.