Аударманың Өзекті мәселелері алматы, 2015

жүктеу/скачать 2,17 Mb.

Pdf көрінісі

бет	38/103
Дата	23.10.2022
өлшемі	2,17 Mb.
	#45033
түрі	Бағдарламасы

1 ... 34 35 36 37 38 39 40 41 ... 103

Байланысты:
audarmanyng ozektigi Kulmanov

доминация қатынасы (отношение непосредственной доми-
нации) деп аталатын 31 қатынасы жеке бөлініп алынды. Мұндай
синтаксистік талдаудың негізгі мақсаты аударылатын сөйлемнің
сөздері арасындағы синтаксистік байланысты анықтау болып
табылады. Ол үшін мұндай байланыстарға қажетті тікелей
доминация қатынастарын тіркеп жазу және оның мазмұнына
қатысты ерекше сипаттамалар сәйкестендірілуі қажет болады.
Автоматты талдау жүйесінің мәтінді аудару, реферат алу, ақпаратты
іздестіру сияқты қолданбалы мәнімен бірге, теориялық жағы да аса
құнды деуге болады. Себебі, талдау алгоритмі «тілдегі талдаушы
бөліктің» әрекет ететін және эксперименталды түрде бақыланатын
моделі болып табылады [37].
Кезінде Ленинград университетінің математикалық лин-
гвистика зертханасында (НИИММ) ағылшынша-орысша аударма
жүйесі тәжірибелік тексеру дәрежесіне дейін жетті [41]. Бұл
жүйеде талдау мен жинақтауды бір-біріне тәуелсіз қарастыру
мүмкіндігі есепке алынды.
Ал өңдеу мен түсініктеме беру әдістерінің міндеттері –
бірізділікке келтіру. Талдау әдісі фразалық және көптік сипатта

112
жүргізілді. Бағыныңқылық грамматикасы моделінің шеңберінде
тұжырымдалған лингвистикалық мәліметтер, оларды өңдеу
шараларынан (алгоритмдерден) жеке қарастырылды. Ал алгоритм
жұмысының нәтижелігі синтаксистік талдау әдісін дұрыс жүргізу,
жобалау, тарамдалу (древесность), байланыстың міндеттілігі,
ортақтығы және т.б. шарттарын қамтамасыз ету арқылы жүзеге
асты.
Көп ұзамай-ақ, жоғарыда аталған зертханада байланыстың
тұйықталу сипатына айрықша мән беру мен реттілікті есепке
алатын орыс тілінің синтаксистік жүйесін құру және оны
тәжірибелік сынақтан өткізу жұмысы жүргізіледі [42].
Ю.Д.Апресянның жетекшілігімен ИНФ-ЭЛ атты лингвис-
тикалық жағынан аса күшті жабдықталған французша-орысша
аударма жасау жүйесі құрылды [40].
Аударма үстіңгі (поверхностный) синтаксистік құрылым
деңгейінде жүргізіліп, мына принциптерге негізделді:
1) аударылуға тиісті тілдердің грамматикаларының сипатталуы
«мән–мағына–мәтін» («смысл–текст») атты бірыңғай модель
негізінде құрылуы;
2) талдау мен жинақтау ережелерінің бір-біріне ауысу
мүмкіндігіне және олардағы ақпарат көлемінің жеткілікті болуы;
3) грамматика мен сөздікке қатысты сипаттаулардың
алгоритмдер мен программалардан бөлектік сипаты (аудармаға
қатысты ережелерден басқа);
4) аударуға қатысты тілдердің сипаттауларының тәуелсіздігі;
5) әртүрлі пәндік салаларға бейімделуінің әмбебаптылығы;
6) лингвистикалық білімді бейнелеу үшін формалды аппаратты
(модель және тіл) құру.
Бірінші кезекті ИНФ-ЭЛ жүйесі «ИРИС-50» ЭЕМ-да жүзеге
асты.
Мәскеудегі М.Торез атындағы шет тілдер институтында АРМАС
атты машиналық аударма жүйесі үшін көпаспектілі ағылшынша-
орысша сөздік құрастырылды. Оның мақалалары сөздік
бірлігінің әр алуан лингвистикалық сипаттамаларын қамтиды:
морфологиялық, синтаксистік, семантикалық, лексикалық қызметі
жайлы мәліметтер, меңгеру моделіне қатысты аударма баламалары
жайлы және т.б. [43].

113
Бұл сөздік АРАП атты ағылшынша-орысша автоматты аударма
жүйесінің лингвистикалық жабдықталуының маңызды бөлігі
ретінде түзілді (жетекшісі – З.М.Шаляпина). АРАП жүйесі үшін
қабылданған ұстаным ЯРАП атты жапонша-орысша автоматты
аударма жүйесі үшін де қолданылды.
Аталған жүйелер үшін талдау жұмысы семантика-синтаксистік
деңгейде жүргізілді. Тілдік бірліктердің семантикалық тіркесін
зерттеу мақсатында арнаулы тіл құрастырылып, барлық негізгі
лингвистикалық ақпараттар біртиптік сөздік мақалалары
түрінде көрініс тапты. Оларда сөздік бірліктері грамматикалық,
лексикалық, тіркесімдік және басқа да әр фразаны аударуға
жеткілікті белгілер түрінде көрініс тапты.
Бүкілодақтық аударма орталығы жұмысының екінші кезеңінде
бірнеше аударма жүйелері құрастырылды. Олардың ішінен тек
екеуін ғана атап өтейік: Н.Н.Леонтьева жетекшілік еткен ФРАП
атты французша-орысша автоматты аударма жүйесі [44] және
Ю.Н.Марчук жетекшілік еткен АМПАР атты ағылшынша-орысша
автоматты жүйе [45].
ФРАП жүйесі аудармашының әрекетін модельдеуге арналған
аса қызықты талпыныс деуге болады. Аударылатын мәтін тілінің
аудармашының ана тіліне қатысты еместігі ескерілді, сондықтан
мәтін ішінде аудармашыға белгісіз тілдік элементтердің
кездесетіндігі де есепке алынған. Ғылыми тұрғыдағы мұндай
зерттеудің мақсаты – таза грамматикалық тәсілдің «күшін» анықтау.
Осыған байланысты аударма процесі қажетті фразаны талдау
деңгейінің белгілі сатысына сәйкес келетін көптеген топтамаларға
(блоктарға) бөлінеді. Ең алдымен формалды-грамматикалық
құралдардың барлық мүмкіндіктері пайдаланылады, ал содан
кейін ғана талдаудың семантикалық деңгейі іске қосылады.
Семантикалық деңгейдің грамматикалық деңгей тәріздес, сан
жағынан бірнешеу болуы алдын ала ескерілген. ФРАП жүйесіндегі
аударманың концепциясы жүйенің синтаксистік компонентінің
«күшін» бағалайды. Бұл жүйенің ерекшелігі – аса дамыған
семантикалық аппаратпен әрекет етуі. Бірінші синтаксистік
топтаманың жұмысы аяқталғаннан кейін ғана келесі семантикалық
аппаратқа бетбұрыс басталады. Жүйенің әр деңгейіндегі ішкі
кішігірім жүйелерді тәжірибелік сынақтан өткізу де алдын ала
қарастырылған.

114
Грамматикалық және дамыған лексикалық талдауларға
бағышталған АМПАР жүйесі де көпдеңгейлі. Онда сөз
айналымдары, бірмағыналы және көпмағыналы сөздер жеке
топтамалар арқылы өңделіп, тек сөйлем құрылымдары ғана
өзгеріске ұшырайды. Аталған жүйе іс жүзінде қолданыс табуда.
Белгілі ғалым, профессор Р.Г.Пиотровский жетекшілік ететін
Бүкілодақтық «Статистика речи» тобы 1970 жылдан бастап
машиналық аударма жүйесі бойынша зерттеулер жүргізді. Бұл
жүйе қазіргі уақытта да актуалды болып саналатын итеративті-
стратификациялық тәсілге негізделеді. Мұндай әдіс бойынша
аударуға тиісті мәтінді қайшылықсыз сипаттау үшін ол кезеңдік
сипатта қарастырылуы қажет.
Ленинградтағы А.И.Герцен атындағы Педагогикалық инсти-
туттың инженерлік лингвистика зертханасында 1975 жылдан
бастап зерттеле бастаған СИЛОД атты аударма жүйесі көптілді
жүйе ретінде өз міндетін атқара бастады. Оның сөздіктермен және
морфологиялық тұрғыда жабдықталуы аса күшті және құрамында
трансфер қолданыс табатын грамматикасы бар жүйе болып
саналады.
Осы кезеңдерде ағылшынша-орысша және французша-орысша
машиналық аударманың түрлері құрастырылып, тәжірибелік
сыннан өтеді. Осы әрекеттердің нәтижесінде жекеленген
синтаксистік конструкциялардың құрылымы мен мағынасын
тануға мүмкіндік тудыратын талдаудың фреймдік және тезаурустық
негіздері қаланады [46; 47; 48]. Аталған жүйеде машиналық
аударманың алғашқы кезеңінде ұсынылған «фулькрумдар»
әдісінің дамыған түрі ретінде саналатын машиналық аударма
алгоритмдерін деңгейлік тұрғыда құрастыру ескерілген.
Машиналық аударма жүйелерін құрастырудың екінші кезеңін
қысқаша қарастыра отырып, олардың негізгі сипаттамалары мен
жалпы ерекшеліктерін былайша атап кетуге болады [19; 25]:
1) көпдеңгейлі талдау мен синтаксистік деңгейдің толық
дәрежеде көрініс табуы;
2) талдау нәтижелерінің көпнұсқалылығы. Аталған жайт
көптеген мүмкіндіктердің ішінен ең дұрысы деп саналатын біреуін
ғана таңдап алу ықтималдығын күшейтеді.
3) лингвистикалық мәліметтерді сақтайтын қатал алгоритмнен

115
барынша «жұмсақ» жүйеге ауысу мүмкіндігі. Соңғы жүйеде
барлық лингвистикалық мәліметтер олардың алгоритмінен
бөлектелген [41; 19].
Жоғарыда
аталған
жүйелердің
сипаттамалары
мен
ерекшеліктері машиналық аударма жұмысын ұйымдастыруға оң
әсерін тигізді. Басқаша айтқанда, олар тілшілер мен математика
мамандарына жүйенің ерекшелік аспектілерін қарқынды түрде
зерттеуге бағыт-бағдар беріп, ынталандыруға себепші болды.
Сонымен бірге аталған жайт тілдің формалды моделін құру жолын
зерттеу мен оны дұрыс қолдану мүмкіндіктерін анықтауды қажет
етті. Ал табиғи тілді формалды сипаттау әдісі грамматикаларды
бірізділікке келтіруге мүмкіндік тудырды. Сондықтан машиналық
аударманың даму кезеңінің екінші сатысында әртүрлі тілдерді
сипаттау үшін формалды модельдер қолданумен бірге тілдік
деректерді қалаған дәлдікпен (адекватно) сипаттауға мүмкіндігі
мол жаңа модельдер үлгісін құру қажет болды.
Сонымен, машиналық аударманың даму кезеңінің екінші сатысы
бірінші буынға қатысты практикалық жүйелердің дамуымен,
тәжірибе жинақтаумен, оны іске қосумен, сөздік базасының кең
түрде өріс алуымен және тәжірибелік тұрғыда болса да барынша
жабдықталған теориялық жүйелерді құрумен сипатталады.
Қол жеткен практикалық және теориялық нәтижелер
машиналық аударманың даму сатысының келесі үшінші кезеңіне
көшуге даяр екендігінің айғағы болып саналды. Бірақ келесі
сатыға өту жолы бірнеше экстралингвистикалық деректерді алдын
ала анықтап алуды қажет еткені белгілі.
Біріншіден, 70-ші жылдардың аяғында ақпарат ағымы бұрын-
соңды болмаған қарқында дамиды. Мысалы, америкалық және
канадалық корпорациялар бір жылдың ішінде 2,5 млрд. сөзге дейінгі
мәтіндерді аударып отыруға мүмкіндігі болған. Егер АҚШ-та 1966
жылы аударма жұмысының біржылдық шығыны 22 млн. доллар
болса, 1981 жылы ол шығын 200 млн. долларға дейін өседі. Кеңес
Одағында штаттағы аудармашылардың айлығын санамағанда,
тек тапсырыс бойынша орындалатын аударма жұмысының өзіне
орасан үлкен қаржы жұмсалған екен. Бірақ ақпарат ағымының
(ғылыми-техникалық мәтіндер, патенттер, құжаттар мен арнаулы
қағаздар) соншалық үлкен дәрежеде болуына байланысты оларды

116
тек дәстүрлі жолмен, яғни аудармашылар күшімен аударып
шығу мүмкін емес еді. Сол себепті, қазіргі кезде автоматтандыру
арқылы техникалық стильдегі мәтіндерді аударуды жеңілдету мен
жетілдіру маңызды мәселеге айналып отыр.
Екіншіден, спеллер типті өндірістік лингвистикалық процес-
сорларды құрастыру мен оларды баспа мен лексикографиялық
жұмыстарда іс жүзінде қолдану, сол сияқты сөздерді өңдеу
жүйесінде (word processors) күшті терминологиялық банктерді
пайдалану – «лингвистикалық» автоматтанған жүйелерді қолдану
арқылы нақты практикалық нәтижелерге ие болу мүмкіндігінің
кепілі.
Үшіншіден, машиналық аударманың жаңа кезеңіне өтуге
қатысты ерекше жасалған алғышарт ретінде есептеу техникасының
дамуына байланысты барынша жағдай жасалуы – дисплейлердің
пайда болуы, дербес компьютерлер мен сканерлердің өмірге келуі,
дербес ЭЕМ-ның күш-қуатының өсуі және т.б. Міне, осының
бәрі теоретика-лингвистикалық зерттеулерге көзқарасты басқаша
өзгертіп, оны практикалық деңгейге дейін көтерді.
Машиналық аударма жүйелерін құрудың бірінші және екінші
кезеңдерін сипаттауда, біз нақты лингвистикалық ұжымдардың
жұмыстарына айрықша назар аудардық. Ал енді машиналық
аударманың қазіргі кезеңін сипаттау үшін оның стратегиясын
таңдау мен практикалық жүйелерін тиімді пайдалануға
байланысты негізгі теоретикалық және техникалық мәселелерді
анықтауға қатысты кейбір мәселелерге тоқталайық. Әрине,
машиналық аударманың мұндай негізгі мәселелерін талқылау
машиналық аударма жүйесінің болашақтағы даму жағдаятын да
сөз етуді қажет етеді.
Бірінші мәселе мынадай мүмкін болатын үш түрлі теориялық
стратегияны талқыға салуды қажет етеді:
– тікелей бинарлық машиналық аударма;
– трансфер арқылы аудару;
– аралық-тіл арқылы аудару, сонымен бірге олардың грам-
матикалық мүмкіндіктерінің ерекшеліктерін іске асыру.

жүктеу/скачать 2,17 Mb.

Достарыңызбен бөлісу:

1 ... 34 35 36 37 38 39 40 41 ... 103