Аударманың Өзекті мәселелері алматы, 2015

жүктеу/скачать 2,17 Mb.

Pdf көрінісі

бет	37/103
Дата	23.10.2022
өлшемі	2,17 Mb.
	#45033
түрі	Бағдарламасы

1 ... 33 34 35 36 37 38 39 40 ... 103

Байланысты:
audarmanyng ozektigi Kulmanov

Көптік аударма жүйесі аталған қатаң тәуелділікте болуына
қарсы мүмкіндіктер тудырып, талдау мен жинақтаудың тәуелсіз
алгоритмдерін құрастыруға жол ашты. Бинарлық аудармалардың
қосындысы ретінде түсіндірілетін көптік аудармадағы тіл
жұптарының саны n(n-1) формуласы арқылы анықталады. Бұл
өрнектегі n – аудару процесіне қатысатын тілдер жиынының саны.
Көптік жүйлерді зерттеуші ғалымдар талдау мен жинақтаудың
баламасы (инвариантты) ретінде аралық-тіл идеясын
(интерлингва) ұсынды [24].
Көптік аударма жасаудағы «аралық-тіл» идеясын іске асыруда
ең алғашқы елеулі орынға ие болатын ғалымдардың ішінен
Н.Д.Андреевтің аты бөліп айтуға тұрарлық [38].
Н.Д.Андреев
жетекшілік
еткен
зертхана
(ЭЛМП)
қызметкерлерінің осы бағыттағы көптеген ғылыми еңбектерінің
жарияланғаны осы саладағы мамандарға мәлім. Осы кезде Кеңес
Одағы мен шетелдердің ғылыми орталықтарымен басқа да ғылыми
топтар арасында аралық-тіл мәселесіне қатысты ой-пікірлер қызу
түрде талқыға түсе бастады.
Н.Д.Андреевтің концепциясы бойынша, аралық-тіл ұғымының
негізінде табиғи тілдердің табиғатында конгруэнттік сипаттың
болмайтындығы жайлы түсінік жатыр. Яғни аралық-тілдің
жасандылығының заңды екендігі, сол себепті одан конгруэнтті
емес элементтердің (артикльдер және т.б.) алынып тасталуы мен
көптеген тілдер үшін конгруэнтті элементтердің (етістіктің үш
түрлі шағы, көптік жалғау және т.б.) сақталып қалуы қажеттігі
туындайды. Сондықтан аталған мәселеге арналған алғашқы
зерттеулерге аралық-тіл өзінің құрылымы жағынан табиғи тілге
жақын тұрып, соның терминдерімен баяндалады.
Аралық-тіл идеясын өмірге әкелу мақсатындағы сан алуан
әрекеттерге қарамай, көптеген тілдерден бір тілге аудару
тәжірибесі машиналық аударма тарихында айтарлықтай өз орнын
ала алмады деуге болады. Теориялық тұрғыдан қарастырғанда
оның себебі аралық-тілдің грамматика мен лексика терминдерінде
сипатталуында деп түсіндіріледі. Шындығында, ол тек қана
семантикалық тұрғыда, семантикалық барабарлық түсінігінде
көрініс табуы қажет болатын.
Сыншылар аралық-тіл арқылы аударма жасаудың төмен

105
дәрежедегі барабарлығын айта келе, оның аударуға тиісті мәтіннің
маңызды сипаттамаларының назардан тыс қалып қоятындығын
айтады: мәтін авторының коммуникативтік және праграматикалық
ұстанымы, талдаудың актуалдығы және т.б.
Машиналық аударма жүйесіндегі аралық-тілдің жүзеге аспай
қалуын лингвистикалық зерттеулердің практикалық тұрғыдағы
көзқараспен түсіндіретін болсақ, ол өзгеріс енгізу кезеңдерінің
әдеттен тыс күрделілігінен, ал техникалық жағынан алғанда
ЭЕМ-ның алғашқы буындарының жад көлемі мен әрекет
жылдамдықтары көрсеткіштерінің төменгі дәрежелігі деуге
болады. Мұндай кедергілер бинарлы аударманың экспериментті
жүйесін құру жағдайында да теріс әсерін тигізді.
Қазіргі кезде аталған кедергілер әртүрлі аралық-тілді
іске қосу кезінде өз шешімін табуда. Аралық-тіл мәселесіне
қызығушылықтың екінші айналымы – жасанды интеллект жүйесін
құрастыруға байланысты. Себебі, тек осы идея бойынша ғана
қазіргі кездегі кибернетика саласында зерттеліп жатқан мәтіннің
мазмұнын түсінетін интеллектуалды жүйелерге жол ашылды
деуге болады. Бірақ бүгінгі таңның өзінде-ақ аралық-тіл арқылы
машиналық аударма жұмысын жүзеге асыру кез келген аударма
жүйесін құрастырушының арманы, жоғарғы мұраты деуге болады.
Солай бола тұра, аралық-тіл мәселесін зерттеу семантикалық
теорияның, табиғи тілдің фразалары мен мәтіндерінің
семантикалық көрінісін анықтау жағдаяттарының даму процесіне
зор ықпалын тигізді.
Машиналық аударманың дамуына аралық-тіл концепциясының
ешбір күмәнсіз үлесі – аударылған және аударылатын тілдердің
қасиеттеріне ғана негізделетін анализ бен синтездің бір-біріне
тәуелсіз екендігін мойындау; аударылатын сөйлемнің мән-
мағынасының үйлесімділігі мен әмбебаптық берілісін зерттеу
қажеттігін мойындау болып табылады.
Машиналық аударма жүйелерін құрастыру аясындағы
жүргізіліп жатқан жұмыстардың белсенділігіне қарамай, бірінші
кезеңде зерттеушілердің ойлағанындай практикалық нәтиже
алынбады. Аударманың тұтынушы сұранысын қанағаттандыра
алатын өндірістік жүйесін құру жұмысының нәтижесіз болуының
үлкен зардабы байқалды. Мысалы, зерттеушілердің бір бөлігі

106
машиналық аударма мәселесін шешуден бас тартты. Осы бағытта
жұмыс істейтін бірнеше топтың зерттеу әрекеттерінің тоқырап
қалуына себепші болған АҚШ-тың Ұлттық Ғылым академиясының
арнайы комиссиясының әуе соғыс күштерінің машиналық аударма
жайлы жасаған талдау қорытындысын бұрмалап түсінудің
(экстраполяция) де өз рөлі болды. Осының зардабынан көптеген
ғылыми ұжымдар ұйымдастыру мен қаржылық қиындықтарға
әкелді [19, 14-б.].
Мұндай жағдайға душар болу кейбір ғалымдардың скепсистік
көзқарасы да, машиналық аударма идеясының жүзеге асу
мүмкіндігіне сенімсіздік білдіруі де, әсіресе, ғылыми-техникалық
мәтіндерді аудару мүмкіндігіне күмән туғызуы да себепші болды.
Ал көркем әдебиет мәтіндері, оның ішінде, әсіресе поэзия мәтініне
байланысты машиналық аударма жасауға ең басынан-ақ ғалымдар
қарсылық пікір білдірген болатын. Оған шығарманың көркемдік,
бейнелік жағын ұстаным етудегі кейбір тілдік заңдылыққа қайшы
келу жақтары негізгі себеп болды.
Осындай жағдайға байланысты И.Бар-Хиллелдің көзқара-
сына тоқтала кетуге болады. Ғалым жоғары сапалы толық
автоматтандырылған машиналық аударма мүмкін емес және оны
утопия деп санаған. И.Бар-Хиллелдің пікірінше, машиналық
аударма кезіндегі негізгі кедергі сөздердің көпмағыналығы және
тіл табиғатында ондай екімәнділікті ажырата алатын формалды
көрсеткіштердің болмауы. Бұл қиындықтардың шешімі тек әлем
туралы білімде жатыр деп тұжырым жасайды [39].
Жоғарыда айтылған сенімсіздік пікірлер әлем бойынша
машиналық аударма мәселесімен айналысатын топтар санын
азайтуға әкеліп соқтырды, екінші кезеңнің аяғында 100 топтан 38
топқа дейін азайғанын айтуға болады [19, 16-18-бб.].
Бірақ машиналық аударманың болашағына сенімді, дәйекті
көзқарастағы ғалымдар қажымай, шаршамай-шалдықпай
жоспарлаған ғылыми ізденістерін жалғастыра бергені сала
мамандарына мәлім. Енді машиналық аударманың екінші кезеңі
басталды. Машиналық аударма мамандары зерттеудің теориялық
жағын тереңдете түсіп, формалданған лингвистикалық модельдер
жасауға, жүйелі және функционалды грамматика жазу мәселесіне
кірісті. Бұл кезеңде семантиканы модельдеу жұмысына арнайы

107
назар аударылды. Бірінші кезеңнің нәтижелері сараланып,
болашақтағы прагматикаға бағышталған жүйе құрудың мүмкіндігі
анықталды.
Бірінші кезеңде зерттеле бастаған формалды грамматиканың
модельдері: теоретика-көптік модельдер, бағыныңқылықты
грамматикалардың модельдері, тікелей құрастырушылар, туын-
дату грамматикасы мен семантикалық модельдер және т.б. Екінші
кезеңде машиналық аударма мәселесінің зерттелуі өз жалғасын
тауып, оның интерпретациясына, яғни түсініктеме берілу
жағына көбірек көңіл бөлінді, машиналық аударма мәселесі жеке
тілдердің грамматикалық құрылымының азды-көпті толық түрдегі
сипаттамаларында да қолданыс тапты. Сонымен бірге, олар
автоматты талдаулардың іргелі алгоритмдері бойынша да сыннан
өтті деуге болады.
Екінші кезеңге қатысты мынадай жайттарды атап кетейік:
семантикалық талдау принциптерінің бұрынғыдан да қарқынды
түрде зерттелуі және жоғары сапалы аударма жасауға қатысты
талдаулар жасау жүйелерінде семантиканың қатысынсыз
мәселенің шешілмейтіндігін толық мойындау.
Соңғы айтылған жайтқа байланысты, яғни семантикаға
байланысты: біріншіден, кейбір машиналық аударма жүйелерінде
талдаудың айрықша семантикалық деңгейін (деңгейлерін) енгізу
арқылы (мысалы, ФРАП), ал екіншілерінде – алдын ала белгілі
синтаксистік қатынастар типтерінің кең түрдегі синтаксистік
сипаттағы тізбесі арқылы мәселені шешу (мысалы, «мән-мағына –
мәтін» моделінде), үшіншісінде – аралық-тіл типіндегі мән-мағына
инвариантын ұсыну арқылы және осыған әкелетін семантикалық
ережелерді қолдану арқылы және т.б. Машиналық аударма жүйесін
құруға байланысты жұмыстардың екінші кезеңде жалғасуымен
бірге, ол кезең аударманы автоматтандыруды тәжірибелік сыннан
өткізу және оны өндіріске енгізу әрекеттерімен қоса сипатталады.
Сөздік пен базалық алгоритмдердің көлемдерін ұлғайту
арқылы Джорджтаундық жүйе (GAT) және олардың жекелік
түрлері даму үстінде болды (мысалы, SYSTRAN жүйесі). 1976
жылы бұл жүйенің ағылшынша-французша нұсқасы Еуропалық
Экономикалық бірлестік қоғамына тапсырылды. Аталған жүйеде
негізі синтаксистік байланысты тағайындайтын талдау тәсілі

108
ескерілген болатын [26]. Анализ бен синтездің бір-біріне барынша
тәуелсіз болуынан оларды басқа салалас тілдік жүйелерге де
қолдану мүмкіндігі туындады.
Өткен ғасырдың 70-жылдарынан бері зерттеліп келе жатқан
Гренобльдық орысша-французша аударма жүйесінің (GETA)
жетілдірілген түрі логикалық пішіндегі терең синтаксистік
құрылымдарды алуды көздейтіні мәлім. Бұл жүйе бойынша
семантикалық, синтаксистік, морфологиялық және сөздік деректері
арқылы бірнеше өңдеулер (трансформаций) жүргізе отырып,
«шығыс» тілдің (выходной язык) үстірт тұрпатының (поверхностная
форма) көрінісін анықтауға мүмкіндік туады. Көпдеңгейлік талдау
өңдеудің 11 топтамасының реттік тәртібі түрінде құрылады.
Мысалы, аналитикалық тұлғаны синтетикалыққа келтіру,
фразаны сегменттеу, есім топтарын талдау және т.б. Мұндай
әрекеттер антецеденттерді іздестіру мен қалпына келтірілген
түйісу нүктелерінің синтаксистік және логикалық фунцияларды
анықтауға дейін өз жалғасын тапты. Аталған жүйе ARIANE атты
дамыған программалық (бағдарламалық) жабдықталуға ие болды.
Мысалы, ол жүйе мен тұтынушы арасындағы әрекетті деректер
базасы арқылы алдын ала қарастырумен қатар, процесті басқару
мен мәтінді өңдеуде де аса дамыған құралдар қолданыс тапты.
TAUM жүйесінде (Монреаль университеті, Канада, жетекшісі
– Р.Китредж) ағылшынша-французша аударма үстірттік
(поверхностный) синтез деңгейінде жүзеге асады [40]. Аталған
жүйе лексикалық және құрылымдық жағынан өңдеу міндетін
атқаратын трансфер топтамасына (блогына) ие. Оған лексемаларды
аудару, француз тіліндегі фразаны синтездеуді жеңілдету үшін
құрастырушылар таралымының (дерево) кейбір бөліктерін өңдеу,
етістіктің шақтық түрін және меңгеру моделін (модели управления)
аудару мәселелері қамтылды. Программаны (бағдарламаны) жазу
тілі ретінде А.Кольмер құрастырған Q (Quebec) тілі алынған [40,
92-б.]. Бұл жүйедегі талдағыштың комбинаторлығы мен икемділігі
(талдаудың алғашқы болжамын аяғына дейін сақтау, ережелердің
қолдану тәсілдерінің ретін белгілеу және т.б.) аударманың үстірттік
синтаксиске бағышталуына мүмкіндік тудырады.
TAUM жүйесі 1968 жыл мен 1980 жыл аралығында белсенді
түрде дамып, нәтижесінде 1977 жылдан бастап аталған жүйе жыл

109
сайын 5 млн. сөз көлеміндегі мәтіндерді аударуды жүзеге асырып,
өндірістік жүйе дәрежесіне дейін көтерілді [20, 12-б.].
Чехославакиядағы Карлов университетінің алгебралық және
есептеу лингвистикасы тобы П.Сгаллдың ғылыми жетекшілігімен
жай сөйлемдерді ағылшын тілінен чех тіліне шектеулі сөздік
бойынша аударма жасайтын машиналық аударма жүйесін
құрастырды [40, 84-б.]. Бұл жүйеде талдау процесі негізгі төрт
кезеңнен тұрады: морфологияға дейінгі талдау, морфологиялық
талдау, синтаксистік талдау, аудару. Синтаксистік талдау
синтаксистік ережелердің әрекет ету аясының кеңейтілген
типі ретінде құрылған: алдымен шағын мәнмәтіннің бірліктері
талданады және әрі қарай оның көлемі біртіндеп ұлғайып,
сөйлем шеңберінен сырт шығатын мәнмәтін көлеміне дейін
өседі. Сондықтан мұны әдеттегі «төменнен жоғары қарай» талдау
жағдайына жатқызуға болады. Осыған байланысты синтаксистік
талдаудың өзі де бірнеше кезеңге бөлінеді. Аталған жүйеге жүйесіз
(нерегулярный) синтаксисті, мағынаны дұрыс ашуға қажетті
сөйлемде жоқ элементтерді толықтыру ережелерін талдау үшін
«авариялық» деп аталатын грамматика енгізілген. Синтаксистік
қатынастарға семантикалық түсініктеме беру тәсілі кең түрде
қолданыс тапқан.
Шамамен алғанда, 1970 жылдан бастап, SUSY жүйесін
құрастыру жұмысы басталады [40, 90-б.]. Аударма жасау процесі
деректерді алдын ала дайындаудан, талдаудан, өңдеуден және
синтездеуден тұрады. Аударма алгоритмін жасау әр тілдің
грамматикасына тәуелсіз сипаттау принципіне негізделеді,
сондықтан жүйеге жаңа тілді қосу әртүрлі жаңа бағдарламаларды
құрастыру әрекетін сан жағынан шектейді. Неміс, орыс, ағылшын
және француз тілдерін талдау, ал сонымен бірге неміс тіліне
қатысты синтездеу жұмыстары жүйелі түрде жүргізілді. Туындау
таралымы (дерево) түріндегі «базистік құрылымды» – талдау
жұмысының нәтижесі деуге болады. Сөздіктер жүйесі (талдау
сөздіктері, семантикалық сөздіктер және аударма сөздіктері)
әсіресе талдау процесіндегі семантикалық ақпарат үшін аса
маңызды болып келетін кез келген ақпаратты пайдалануға
мүмкіндік туғызады. Талдау принципі өзара қисынды түрде
құрастырылған: талдаудың бірінші бөлігі «жоғарыдан төменге

110
қарай» өңдеуден басталады, екінші бөлігі «төменнен жоғарыға
қарай» өңдеуден басталады, ал үшінші бөлікте алдыңғы екі нәтиже
бір-біріне тіркесіп орындалады («жапсырылады»). Талдау соңында
бұрыс синтаксистік құрылымды өңдеу шаралары қарастырылған.
Машиналық аудармамен айналысатын ресейлік топтардың сан
жағынан аз болуына қарамай, сөз болып отырған екінші кезеңде
олардың зерттеу жұмыстарын аса нәтижелі деп сипаттауға болады:
а) лингвистикалық және математикалық жабдықтау тұрғысынан
алғанда, бастапқы машиналық аударма жүйелерінің жақсартылған
түрлерінің құрастырылуы;
ә) жаңаша типті жүйелердің құрастырылуы (Бүкілодақтық
аударма орталығы, А.И.Герцен атындағы ЛГПИ-дегі «Статистика
речи» тобы);
б) автоматтанған талдау жүргізетін жүйелердің қарқынды
түрде зерттелуі;
в) машиналық аударма жүйелерін әртүрлі мәндік дәрежеге
қатысты тәжірибелік сынау деңгейіне дейін жеткізілуі және бұрын-
соңды құрастырылған жүйелердің жетістіктері мен кемшіліктері
бірдей дәрежеде сыннан өту нәтижелері осыны байқатады.
Аталған кезеңде КСРО ҒА-ның Қолданбалы математика
институтында французша-орысша машиналық аударма жүйесінің
жаңаша түрі (жаңаша версиясы) құрастырылды. Француз тіліндегі
математикалық мәтінді орысшаға аударатын бұл жүйе 1967-
1976 жылдар аралығында О.С.Кулагинаның ғылыми жетекшілігі
бойынша зерттеу жұмыстарын жалғастырды [19].
Жүйеде аударма әрекетіне қатысты өңдеу жұмыстары былайша
іске асты: жүйеге «кіретін» ақпарат французша фразаның үстіңгі
синтаксистік құрылымы (фраза бойынша аудару), ал жүйеден
«шығатын» ақпарат – мән-мағыналық сәйкестікте тұратын орысша
фразаның үстіңгі (поверхностный) синтаксистік құрылымы.
Мұндай тәсіл екі түрлі тілдердің сөздері мен фразалары
мағыналарының сәйкестігі мен олардың құрылымдық сәйкестік
сипатына негізделеді. Бұлайша талдаудың негізгі мақсаты
бағыныңқылықтар таралымы (дерево) түріндегі фразалардың
синтаксистік құрылымдарының жиынын құру. Осылайша талдау
әдісін жүргізе отырып, синтаксистік байланыстың 52 типі жеке
түрде бөлініп алынады.

111
Көпнұсқалық талдауда сүзгі-ережелер жиыны қолданылады.
Мұндай әдіс арқылы синтаксистік байланыстың күші мен
арақашықтығы және байланыстың ортақ немесе ортақ еместігі
(совместность/несовместность
связей),
құрылымдардың
жобалауға болатындығы немесе болмайтындығы (проективность/
непроективность структур) ескеріледі.
Сүзгілерді қолданудың ретіне қарай, олардың иерархиялық
айырым-белгілері есепке алынған. Мысалы, алдымен қарапайым
сүзгі, сосын барып жалпы, күрделі, ал ең соңында жекеленген
жағдайға сай келетін сүзгі түрлері қолданылған. Көпнұсқалы
талдау түрлеріне сүйене отырып, болжамдар жиыны ішінен аталған
сүзгілер арқылы нақты бір болжамды құрастыруға мүмкіндік
туындайды [19; 40].
Орыс тілін синтаксистік талдау арқылы зерттеу жолында
машиналық аударманың алғашқы кезеңінде орын алған
конфигурациялық талдау идеясы қолданыс тапты. Осының
нәтижесінде сөйлем ішіндегі сөздердің әр алуан синтаксистік
қатынас типтерін мағыналық тұрғыда сипаттайтын тікелей

жүктеу/скачать 2,17 Mb.

Достарыңызбен бөлісу:

1 ... 33 34 35 36 37 38 39 40 ... 103