Атты І халықаралық конференция ЕҢбектері


  Қазақ күрделі сөздерін граф түрінде бейнелеу



Pdf көрінісі
бет257/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   253   254   255   256   257   258   259   260   ...   326
Байланысты:
Болатбек М. (1)

2  Қазақ күрделі сөздерін граф түрінде бейнелеу 
Табиғи  тілдегі  мәтінді  өңдеу  процесін  бірнеше  деңгейге  бөлуге  болады:  талдау,  анализ 
және  синтез.  Талдау  деңгейін  табиғи  тілдегі  мәтінді  формалданбаған  түрден  формалданған 
ішкі ұғымға түрлендіретін функция ретінде анықтаймыз. Анализ деңгейі  – ішкі ұғымда бар 
деректерді  түрлендіру  және  соның  негізінде  формалды  түрде  жаңа  деректер  шығару 
функциясы.  Синтез  деңгейі  –  ішкі  формалданған  ұғымға  бара  бар  табиғи  тілде  жауап 
құрастыру функциясы. 
Талдау  деңгейін  бірнеше  тізбектелген  операцияларға  бөлуге  болады:  морфологиялық, 
синтаксистік  және  семантикалық  талдау.  Морфологиялық  талдау  мәтіндегі  бөлек  сөздерді 
алып,  оларды  морфемаларға  бөлу  арқылы  жасалады.  Табиғи  тілде  мәтіннің  синтаксистік 
талдау  операциясы  оның  барлық  синтаксистік  белгілерін  және  семантикалық  талдау  үшін 
керек  болатын  сол  сөздердің  синтаксистік  байланысын  анықтаудан  тұрады.  Семантикалық 
талдау  жүйенің  жадында  сыртқы  әлемнің  ұқсас  моделінің  болғанын  талап  етеді.  Бұл 
талдауда  ұқсас  моделдің  білімдерімен  бірге  мәтінде  тікелей  орналасқан  деректерді 
салыстыру арқылы мәтіннің ішкі формалданған ұғымын тиянақты құрастырылады. 
Морфологиялық сөз түрлену және сөзжасамдарды талдау есептерін шешу үшін формалды 
Маккаллок-Питтстің  нейронды  желісінің  қасиетіне  жақын  семантикалық  нейронды  желіні 
қолданамыз.Маккаллок-Питтс нейронды желісіндегі бөлек нейрондар және, немесе және не 


260 
 
логикалық  операциялары  сияқты  бейнеленеді.  Логикалық  операцияның  орындалуының 
нәтижесіне байланысты нейрондар ақиқат және жалған логикалық мәндеріне сәйкес келетін 
қозу  немесе  тыныштық  күйінде  болады.  Әрбір  нейронның  жұмысымен  байланысты 
уақытылы  кідіру  осында  локикалық  жүйемен  алынатын  тиімді  және  конструкциялық 
сипатына  кепілдік  береді.Желідегі  нейрондар  ақырлы  және  нейронның  күйлер  саны  да 
ақырлы  болғандықтан,  мұндай  нейронды  желілер  күйі  ақырлы  болатын  автоматтар  болып 
табылады. Маккаллок-Питтс желісіндегі нейрон тек екі логикалық күйде болуы мүмкін және 
логика алгебрасының функциясын орындауды ғана қамтамасыз етеді. Табиғи тіл нақты емес 
және толық емес түсініктермен жұмыс істейді Семантикалық нейронды желінің Макколлок-
Питтстің желісінен айырмашылығы мынада, Маккллок-Питтс желісінде Бульдік алгебраның 
логикалық операциялары орындалады, ал семантикалық нейронды желіде бұлдыр логиканың 
операциялары  орындалады.  Бұлдыр  логикада  тұжырымдаманың  ақиқаттығы  дәрежесін 
анықтау үшін сенімділік факторын қолданамыз – кейбір интервалда орналасқан сан, мысалы 
0 мен 1 аралығы. Бұл интервалдың максималды мәні оқиғаның пайда болғандығының толық 
сенімділігі ретінде түсіндіріледі, ал минималды мәні – ол оның толық жоқтығына сенімділік. 
Ықтималдықтар теориясына қарағанда  сенімділік факторы оқиғаның пайда болатындығына 
субъективті  сенімділікті  сипаттайды  және  ешқандай  статистикалық  мағынасы  жоқ. 
Семантикалық  нейронды  желілердегі  нейрондар  табиғи  тілдің  қарапайым  түсініктеріне 
сәйкес  келеді  және  дискретті  градиентті  мәндерді  өңдейді.  Осы  желінің  әрбір  нейронында 
ақырлы  күйлер  саны  болады.  Сондықтан,  семантикалық  нейронды  желі  ақырлы  автомат 
түрінде қарастырыла алады. 
Морфологиялық  және  семантикалық  талдау  жасайтын  семантикалық  нейронды  желінің 
құрылысы ретінде синхрондалған ағаш немесе графты таңдаймыз. 
Мәнін  синхрондалған  сызықтық  ағаш  түрінде  шығарып  алу  қабатын  ақырлы  автомат 
ретінде қарастыруға болады, себебі желідегі нейрондар саны шектеулі және оларда ақырлы 
күйлер мен байланыстар саны бар. Бір күйден екінші күйге өту мәнін шығарып алу қабатына 
кіріс  тізбегінің  кезекті  символын  беру  кезінде  болады.  Мәнін  шығарып  алу  қабатын  бір 
автомат  түрінде  емес,  бірнеше  сөздік  мақалалардың  саны  сияқты  ақырлы  субавтоматтар 
ретінде қарастырған ыңғайлы. Сонымен қатар, бір нейронда тыныштық күйден қозу күйіне 
дейінгі аралығында бір градиентті субкүйі бар деп есептеген ыңғайлы. Әрбір осындай субкүй 
қарапайым  мағына  болсын.  Нейроавтоматтың  бір  белсенді  субкүйіне  бір  немесе  бірнеше 
қозған нейрон сәйкес келеді. Сонда бір синхрондалған сызықтық ағаштың бір үзіндісінде біз 
бірнеше  субавтомат  аламыз  –  сөздік  мақала  санына  байланысты  немесе  бір  мезетте  бір 
автоматта  бірнеше  күй  болады.  Бұл  шешім  кейін  табиғи  тілдің  көптеген  есептерін  шешуге 
көмегін тигізеді. 
Сөздік  мақаланың  нейронының  моделін  қарастырып  өтейік.  Семантикалық  нейронды 
желінің  тізбектей  есептеуіш  жүйесінде  жүзеге  асырылуы  нейронның  жылдамдығына 
қосымша  талаптар  қояды.  Мүмкіндігінше,  бөлек  нейронның  жұмысының  жылдамдығын 
арттырып, желідегі нейронның санын азайту керек, себебі бұл жағдайда нейрондар, бірінен 
кейін  бірі  тізбектей  өңделеді,  сондықтан  жүйенің  бір  тактысының  жалпы  уақыт  өлшемі 
өңделетін  нейрондарды  бір  нейронды  өңдеуге  кететін  уақытқа  көбейткендегі  санына  тең. 
Нейрондардың  санын  азайту  және  олардың  жұмысын  арттыру  үшін  дизъюнктор  мен 
конъюнкторды  бір  нейронға  біріктіреміз.  Бұл  кезде  әрбір  нейронда  екі  дендритті  ағаштан 
болады:  біріншісі  –  кіріс  градиентті  мәннің  дизъюнкциясының  функциясын  орындайтын
басқасы  –  кіріс  градиентті  мәннің  конъюнкциясының  функциясын  орындайтын  және 
дизъюнкция функциясының нәтижесін орындайтын. Нейронды дөңгелекпен белгілейміз, ал 
оның  дизъюнкциясының  дендритін  осы  дөңгелектің  мол  жағына  қоямыз,  конъюнктор 
дендритін дөңгелектің жоғары немесе төмен жағына орналастырамыз, аксон  – дөңгектің оң 
жағында  орналасады.  Ыңғайлы  болу  үшін  дөңгелектің  ішіне  конъюнктордың  дендритіне 
сәйкес келетін символдарды жазамыз. 
Сөздік  мақаланың  моделін  қарастырайық.  Бөлек  сөздік  мақала  ол  мақаланың  негізгі 
мағыналық  күші  болатын  негізгі  сөз,  және  сөзтүрлену  (септелу  немесе  жіктелу)  арқылы 


261 
 
негізгі сөзден алынған сөз формасының тобы болады. Бір сөздік мақала – ол нейрондар тобы, 
немесе    мәнін  шығарып  алу  қабаттағы  бір  нейронды  субавтомат.  Сөздік  мақаланың 
субкүйлерінің  жалпы  саны  сол  мақаланың  сөзжасамдардың  санына  тең  болсын.  Осындай 
субавтоматтың  әрбір  субкүйі  бір  қозған  нейрон  болады.  Бұл  кезде,  бір  мезгілде  бір 
субавтоматтың екі түрлі нейроны қозған жағдайда субавтоматта біруақытта екі түрлі субкүйі 
бар деп айтамыз. Әрбір мақалада сол мақалаға сәйкес келетін негізгі нейрон болады. Сөздік 
мақаланың  негізгі  нейроны  оның  сөздік  мақаласына  жататын  сөз  танылған  кезде  үнемі 
қозған  күйде  болады.  Әрбір  сөз  формасына  бөлек  нейрон  сәйкес  келеді.  Ол  сөз  формасы 
танылған кезде қозады. 
Мәнін шығарып алу қабатта бөлек сөздік мақалаларға жатпайтын нейрондар болады. Бұл 
нейрондар  көптеген  сөздік  мақалаларға  тән  септік,  шақ,  жіктеу  сияқты  сөзжасамдардың 
белгілеріне  сәйкес  келеді.  Олар  сәйкес  белгілері  бар  сөз  формалары  қозғанда  қозады. 
Сөзжасамдардың  белгілеріне  сәйкес  келетін  нейронның  күйлері  сол  нейрондар 
байланысатын сөздік мақаланың субавтоматтарына жатады. Сонда, бірнеше сөздік мақалалар 
бір мезгілде дәл сол күйде болуы мүмкін.  
Субавтоматтың  қозған  нейрондар  жиыны  субавтомат  танитын  бөлек  нейронға  жататын 
белгілер жиынына сәйкес келеді. Жіктеу немесе берілген символдық тізбек бойынша сөздік 
мақаланы  және  сөзжасамды  анықтау  есебі  мәнін  шығару  қабаты  арқылы  қозу  толқынының 
өтуіне және сәйкес сөздік мақала үшін сәйкесінше субавтоматтың қозуына алып келеді. Сөз 
түрлену  есебі  мұндай  субавтоматтың  бастапқы  сөз  түрлену  басталатын  сәйкес  сөз 
формасының  күйінен  алғашқы  сөзжасамына  түрлендіру  керек  болатын  сәйкес  сөз 
формасының ақырғы күйіне өзгеруіне алып келеді. 
Сипатталған есептердің шешімін қамтамасыз ететін нейронды желілердің байланысының 
құрылысын  қарастырайық.  Синхрондалған  сызықты  ағаш  сөздік  мақала  бойынша  сөз 
формаларының жіктелу  және сол сөз формасының белгілерін анықтау  есептерінің шешімін 
қамтамасыз етеді. Егер көпмәнді жағдай туса синхрондалған сызықтық ағашта немесе графта 
сөз формасының барлық бөлек бөлек мәндеріне сәйкес келетін барлық сөздік мақалалар мен 
сөз формалары қозады.  
Сөзтүрлену  және  сөзтудыру  есептерін  шешу  үшін  де  синхрондалған  сызықтық  есепті 
қолдануға  болады.  Бұл  жағдайда  ол  субавтоматты  бір  күйден  екінші  күйге  ауыстыратын, 
қоздыруды  тудыратын  ауыстырғыш  тізбек  ретінде  болады.  Субавтоматтың  күйлерінің 
ауысуы синхрондалған сызықтық ағаштың кірісіне арнайы командалар беру кезінде болады. 
Бұл  командаларды  синхрондалған  сызықтық  ағаш  таниды  және  оларға  сәйкес  келетін 
нейрон-эффекторлардың  шығысында  градиентті  мәнге  түрленеді,  бұл  сөздік  мақаланың 
күйлеріне сәйкес келетін нейрондардың қозуына немесе тежелуіне алып келеді.  
 
 


262 
 


Достарыңызбен бөлісу:
1   ...   253   254   255   256   257   258   259   260   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет