А. Байтұрсынов атындағы Тіл білімі институты қазақ тілінің ұлттық корпусын жасап жатыр

17 Маусым 2023, 10:54
1275
Бөлісу:
А. Байтұрсынов атындағы Тіл білімі институты  қазақ тілінің ұлттық корпусын жасап жатыр
Фото: автордан

Түркістанда өтіп жатқан Ұлттық құрылтайдың кешегі «Білім және ғылым» жұмыс секциясына қатысқан А.Байтұрсынов атындағы Тіл білімі институтының директоры Анар Фазылжанова қазіргі таңда қазақ тілінің ұлттық корпусын жасап жатқанын айтты, деп хабарлайды BAQ.KZ тілшісі.

Оның сөзінше, институт жасап жатқан жоба ресейлік Яндекс компаниясының Алиса сияқты дыбыстық көмекшісі болмақ.

Талқылау өте ұзаққа созылды. Соған қарамастан сол жерде А.Байтұрсынов атындағы Тіл білімі институтындағы қазіргі жасалып жатқан жұмыстар туралы айтып үлгердім. Мәселен, қазір қазақ тілі цифрлық кеңістікке шығу керек. Ол жай шыға салмай, өте сапалы күйде шығу керек. Ол үшін тілтанушылар мен ІТ мамандардың тандемі жұмыс жасау қажет. Мысалы Яндекс компаниясының «Алисасы» сіздермен телефонда тірі адам сияқты сөйлеседі. Яндекс Алисаны жасамас бұрын алдымен орыс тілінің ұлттық корпусы ақылды мәтіндер базасын жасады, соның операторы болды. Яғни лингвистикалық бүкіл тілді көрсететін корпусты жасады. Біздің тіл институты да қазақ тілінің ұлттық корпусын жасап жатыр. Корпусымыздың базасында қазір отыз миллионнан астам қолданыстан тұратын тілтанымдық тұрғыдан ақылды мәтіндер базасы бар. Мен осы туралы айттым. Осының базасын кеңейту керек. Қазір алға қоятын мақсатымыз үлкен, осы жобаға жан жақты қолдау көрсету керек деген мәселені алға тарттым, - деді Анар Мұратқызы.

Оның айтуынша, мысалы ағылшын тілінің корпусында әлдеқашан екі миллиардқа жуық мәтіннің ақылды базасы болса, орыс тілі, жапон, фин тілдерінің базасы бір миллиардқа жақындап қалғанын айтты.

Институт директоры бүгінгі жиыннан Президент халықтың көкейінде жүрген көптеген мәселелердің шешім табуына ықпал ететінін, сарапшылардың бұған дейінгі өткен Құрылтайдан кейін де бірнеше рет жүздескенін тілге тиек етті. 

Өзгелердің жаңалығы