"Манаш Қозыбаев атындағы
Солтүстік Қазақстан университеті"
коммерциялық емес акционерлік қоғамы
Үлкейтілген
Сөздәйектер галереясы

Білім берудің қай түрі болмасын — тәрбие.

Л.Н. Толстой
Факультеттер жаңалықтары
АФ: Дала күні

2025 жылғы 26 маусымда «Сервис-ЖАРС» ЖШС (Қызылжар ауданы, СҚО) өндірістік танаптарында «Солтүстік Қазақстанның орман-дала аймағындағы жайылымдардың ө әрі қарай оқу

ТжӘИ: «Мағжан Жұмабаев: тұлға, әдеби үрдіс және тілтаным» атты Халықаралық ғылыми-практикалық конференция

М.Қозыбаев атындағы Солтүстік Қазақстан университеті Тіл және әдебиетинституты «Қазақ тілі мен әдебиеті» кафедрасы 2025 жылдың 19 маусымында көрнекті  әрі қарай оқу

Барлығын оқу

Қазақ тіліндегі латын мәтіндерін интеллектуалды өңдеу әдістері мен алгоритмдерін зерттеу және әзірлеу

ИРН AP13268833 жобасы Қазақстан Республикасының Ғылым және жоғары білім министрлігі Ғылым комитеті қаржыландыратын «Жас Ғалым» жобасы бойынша жас ғалымдарды гранттық қаржыландыру аясында жүзеге асырылады.

     

Жоба жетекшісі (постдокторант): Икласова К.Е., PhD, «Ақпараттық-коммуникациялық технологиялар» кафедрасының доценті (эл. пошта kiklasova1205@gmail.com, ORCID: https://orcid.org/0000-0002-8330-4282, h-индекс = 3 (Scopus), Scopus Author ID: 57209837609).

Ғылыми консультант (консультант): Куликова В.П., т.ғ.к., «Ақпараттық-коммуникациялық технологиялар» кафедрасының профессоры (эл. пошта v4lentina@mail.ru, ORCID: https://orcid.org/0000-0001-8198-2672, h-индекс = 1 (Scopus), Scopus Author ID: 57209829779).

Орындау мерзімі: 01.05.2022 - 31.12.24 ж.

Ұзақтығы: 32 ай.

Қаржыландырудың жалпы көлемі: 18 974 780 теңге.

 Жобаның мақсаты: Деректерді интеллектуалдық өңдеудің қазіргі әдістері мен алгоритмдерін, атап айтқанда, латын әліпбиіне көшу процесін тиімді басқару үшін қазақ тіліндегі латын графикалық мәтінін әзірлеу және зерттеу.

Күтілетін нәтижелер: Семантикалық транслитерацияны қамтамасыз ететін латын әліпбиіне көшуді қолдау әдістері әзірленетін болады. Бұл нәтиже, механикалық және семантикалық транслитерацияны бағалау, цифрлық ресурстарды одан әрі дамыту үшін қажет. Латын графикасындағы қазақ тілінің субкорпусын қалыптастыру ерекшеліктерін зерттеу (терминологиялық сөздік мысалында). Бұл нәтиже, зияткерлік өңдеу алгоритмдері мен әдістерін әзірлеу және қазақ тілінің корпусын латын әліпбиінде қалыптастыру үшін негіз жасау үшін қажет. Латын қарпіндегі қысқа қазақ мәтіндерін семантикалық талдау үшін машиналық оқытуды пайдалана отырып алгоритмдер мен әдістерді зерттеу/әзірлеу. Бұл нәтиже, латын графикасында ұсынылған табиғи тілдегі мәтіннен ақпарат алу кезінде бағдарламалық құралдардағы ресурстар мен тиімділікті практикалық бағалау үшін қажет. Латын қарпіне көшу үдерісін басқарудың тиімділігін арттыру үшін ұсынымдар/Алгоритмдер әзірлеу. Бұл нәтиже Қазақ тілі жазуының латын графикасына көшу процесін басқару стратегиясын/саясатын қалыптастыру үшін қажет.

Жобаның сипаттамасы: ҚР-да тіл саясатын іске асыру жөніндегі 2020-2025 жылдарға арналған мемлекеттік бағдарламаның маңызды міндеттерінің бірі: латын графикалық әліпби негізінде қазақ тілінің жазуын жаңғырту, оны жетілдіру, унификациялау және кодификациялау; ақпараттандыру және коммуникация саласында қазақ тілінің қолданылуын жетілдіру болып табылады. Осы міндеттерді шешу, латын қарпінде жеткілікті дәрежеде зерттелмеген үлкен көлемді жаппай тұтынудың цифрлық ресурстарын өңдеу үшін ақпараттық-коммуникациялық технологияларды зерттеумен, әзірлеумен және қолданумен тікелей байланысты. Жобаның идеясы латын графикасына көшу процестерінің қайшылықтарын, әлсіз тұстарын, сәйкессіздіктерін анықтау, сондай-ақ латын графикасына тиімді өтуге ықпал ететін қазақ тіліндегі латын графикасы мәтінін зияткерлік өңдеудің тиісті алгоритмдері мен әдістерін әзірлеу болып табылады.

 Мақалалар тізімі:

  1. Yerkebulan, G., Kulikova, V., Kulikov, V., Kulsharipova, Z. (2021). Devising an entropy-based approach for identifying patterns in multilingual texts. Eastern-European Journal of Enterprise Technologies, 2 (2 (110)), 16–22. doi: https://doi.org/10.15587/1729-4061.2021.228695 (Процентиль - 51).
  2. Kulikov, V., Kulikova, V., & Yerkebulan, G. (2021). Google/Yandex Translation Detection in the Patterns Identifying System of Multilingual Texts. International Journal of Computing, 20(1), 72-77. https://doi.org/10.47839/ijc.20.1.2094