Конфигурациялық талдау әдісі аударылуға тиісті мәтінді
(жүйеге енетін мәтін) сол тілдің алдын ала іріктеліп алынған
синтаксистік конструкциялар жиынымен салыстыру тәсіліне
негізделеді [33; 34; 35; 29]. Егер аударма жүйесіне енетін
мәтіннің анықталған конфигурациясы жиынның синтаксистік
конфигурацияларының біреуімен сәйкес келсе, онда мәтіндік
конфигурация танылды деп саналады және ол әрі қарайғы талдау
әрекетінде ықшамдалған түрінде көрініс табады. Синтездеу
әрекетінде анализдеу кезінде анықталған конфигурация
аударуға тиісті тілдің оған сәйкес келетін конфигурациясымен
салыстырылады.
«Фулькрумдер» әдісі бойынша жүргізілетін талдауда мәтіндегі
сөйлем төменгі сатыдағы бөліктерге ажыратылады. Осының
негізінде кез келген фразаны циклдық әдіс бойынша бірнеше
103
рет қарастыра отырып, іріленген фрагменттерге біріктіруге
болады. Әрбір кезекті циклдық қарастыру кезінде талдаудың
тірек нүктелері (fulсra) – фулькрумдер анықталады. Анықталған
фулькрумдер синтаксистік конструкциялардағы негізгі және
«басқарушы» сөздер тобына жатады. Олардың құрылымы мен
шекарасын анықтау циклдық қайталаулардың мақсатына енеді
(группа автомат. Перев. фирмы Bunker Ramo-Woldridqe Inc,
Canoqa Park, Calif., рук. П.Гарвин).
Тізбекті талдау әдісі арқылы фразаның синтаксистік
құрылымын тану үшін берілген сөйлем көрінісіндегі синтаксистік
категориялар тізбегін элементарлық тізбектерге бөлу қажет болады
(Харрис, Н.Сейгер).
Корреляциялық талдау кезінде әрбір сөзге индекстер
жиынтығы тіркеліп жазылады. Олардың әрбіреуі сол сөздің
осыған ұқсас индексі бар басқа сөздермен өзара байланыстылық
(корреляция) мүмкіндігін бейнелейді. Корреляцияның (өзара
қатынастылық) жоғары деңгейі лингвистикалық шектеулер
арқылы төмендетіледі. Мысалы, сөз, семантика және т.б. сатыларға
төмендейді.
Осымен бірге зерттеушілер машиналық аударма мәселесі үшін
толық мәтінді талдау мәселесін қарастыра бастады. Соның ішінен
толық мәтіндердің антецедент – зат есімдермен арақатынасын
анықтайтын ережелердің қарастырыла бастағанын атап кетуге
болады (антецедент – анафоралық қатынас. Мәселен, есімдіктен
бұрын тұратын есім сөз, ал есімдік осы есімге нұсқайды) [36; 37].
Қазіргі кездегі жоспарланып жатқан машиналық аударма
жүйесі екі топқа бөлінеді: бір тілден екінші тілге аударатын
– бинарлы және бірнеше тілдерден бір тілге немесе бірнеше
тілдерге аударуға арналған – көптік. Машиналық аударма
жүйелерінің бірінші түрінің әр уақытта артықтық сипаты адам
баласының аудару әрекетін модельдеудің және әрбір тілдер жұбы
деректерінің бинарлық сәйкестіктерін анықтаудың теориялық және
практикалық мүмкіндіктерінің табиғи жағдаятынан туындайды.
Машиналық аударманың бинарлық жүйелерінің кемшілігі –
аударуға тиісті «кіретін» тілге талдау жүргізу кезінде олардың
қасиеттеріне қатаң түрде тәуелді болуы және әрі қарайғы аударма
алгоритмін құрастыруда ол тәуелділіктің күрделене түсетіндігі.
104
Достарыңызбен бөлісу: |