Қазақстанда жасанды интеллект негізінде қазақ тілінің ұлттық сөздік қоры құрылады

Түсіндірме жазбада жобаның мақсаты қазақ тілінің сөздік қорына қолжетімділікті қамтамасыз ететін және ондағы ақпаратты ақпараттық-коммуникациялық технологиялар арқылы өңдеуді қамтамасыз ететін қазақ тілінің ұлттық сөздік қорының мемлекеттік ақпараттық жүйесін қалыптастыру болып табылатыны айтылған.
Ұлттық сөздік қорды құрудың мақсаты – қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту, сондай-ақ мемлекеттік тіл мәртебесін нығайту, қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау, тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу, өңдеу процестерін автоматтандыру.
Ұлттық сөздік қорды қалыптастыруды және жүргізуді тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға іске асырады.
Ұлттық сөздік қор академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығы болып табылатын датасет негізінде қалыптастырылады.
Ұлттық сөздік қорды қалыптастыру мыналарды қамтиды:
- Ұлттық сөздік қорды құру және дамыту мәселелері жөнінде кезеңдік іс-шаралар жоспарын әзірлеу;
- Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамаларды бекіту;
- интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз ету;
- Ұлттық сөздік қорды құру және жетілдіру саласындағы субъектілердің әрекетін үйлестіру;
- Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесін қалыптастыру;
- ашық деректер платформаларын пайдалану және халықаралық стандарттарға сәйкес келуін қамтамасыз ету.
Ұлттық сөздік қорды қалыптастыру мыналарды қамтиды:
- Ұлттық сөздік қорды құру және дамыту мәселелері жөнінде кезеңдік іс-шаралар жоспарын әзірлеу;
- Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамаларды бекіту;
- интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз ету;
- Ұлттық сөздік қорды құру және жетілдіру саласындағы субъектілердің әрекетін үйлестіру;
- Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесін қалыптастыру;
- ашық деректер платформаларын пайдалану және халықаралық стандарттарға сәйкес келуін қамтамасыз ету.
Ұлттық сөздік қорды жүргізу мыналарды талап етеді:
- сөздердің мағынасын, этимологиясын және жалпы қолдану үлгілерін қамтитын сөздіктер базасын әзірлеу;
- тіл корпустарының орталықтандырылған жүйесін құру;
- қазақ тілінің терминологиялық базасын жетілдіру;
- қазақ тілін қолданудың барлық саласын қамтитын датасет жинауға арналған техникалық талаптарды әзірлеу;
- ғылыми зерттеулер үшін қолжетімді платформа ұсыну;
- қазақ тіліндегі ЖИ модельдерін, заманауи технологияларды интеграциялау;
- интерактивті іздеу жүйесін әзірлеу;
- жүйенің жұмысын тұрақты бақылап, ұсыныстар мен ескертулерді сараптайтын модератор қызметін қамтамасыз ету;
- салалық мамандардан құрылатын мемлекеттік органдарға жатпайтын дербес алқалы топ (сараптау және цифрландыру бойынша жұмыс топтары) жасақтау.
Әзірлеушілер жобаны қабылдау теріс әлеуметтік-экономикалық, құқықтық немесе басқа да жағымсыз салдарға әкеп соқпайды және қосымша қаржылық шығындарды қажет етпейді деп мәлімдеді.
Жоба 2025 жылғы 19 наурызға дейін жария талқылау үшін "Ашық НҚА" порталында орналастырылған.