Аударманың Өзекті мәселелері алматы, 2015

Джорджтауындық эксперимент

жүктеу/скачать 2,17 Mb.

Pdf көрінісі

бет	35/103
Дата	23.10.2022
өлшемі	2,17 Mb.
	#45033
түрі	Бағдарламасы

1 ... 31 32 33 34 35 36 37 38 ... 103

Джорджтауындық эксперимент деген атпен тарихта қалды
[24]. Аталған экспериментте «тікелей» машиналық аударма
жағдаяты (бір тілдік жұпқа қатысты жүйелер) тексерістен өткен
болатын. Жүйе сөздігінің көлемі бар болғаны 250 сөзді ғана
қамтыса, ал оның грамматикасы тек алты синтаксистік ережеге
ғана негізделеді [20]. Кеңес Одағында француз тілінен орысшаға
аударатын машиналық аударманың бірінші эксперименттік жүйесі
О.С.Кулагина мен И.А.Мельчуктың авторлығымен 1955-1956
жылдары құрылғаны осы сала мамандарына белгілі [28]. Бұл
жүйедегі негіз сөздер сөздігі 1236 сөз, ал сөз айналым сөздігі
250 бірлікті қамтиды. Аударма бірлігі ретінде толық сөйлем түрі
есептеледі. Морфологиялық талдау алгоритмі жалғаулардың
кестесімен әрекет ету арқылы аударылатын фразаның (сөйлемнің)
сөздеріне қажетті деген грамматикалық ақпаратты тіркейді. Бұл
жүйенің артықшылығы – омонимдік сөздерді ажырата алатын
топтамасы (блогі) болуында. Орыс тіліндегі фразаны синтездеу
топтамасында сөздердің орналасу тәртібінің дұрыстығын
тексеру мүмкіндігі алдын ала қарастырылған. Сонымен бірге,
Т.Н.Молошнаяның жетекшілігімен ағылшынша-орысша аударма
жасау жүйесінің алғашқы жобасы ұсынылды [29].

100
Машиналық аударма жұмысының бастамасы, жалпы алғанда,
өрлеу сипатында болды – тілшілер зерттеудің жаңа бағытын ашты,
ал программистер күн тәртібіндегі күрделі және аса қызықты
мәселелердің шешімін табуға қызыға кірісті. Бұл кезеңде тіл мен
аударма процесіне қатысты барлық мәліметтерге қол жеткендей
сезілді. Сондықтан егер оларды формалды пішінге келтіру ісі жүзеге
асырылса, машиналық аударманың әмбебаптық жүйесі құрылып,
алға қойылған негізгі мақсатқа тез арада жететіндей көрінген
болатын. Бірақ бастапқы және кейінгі тәжірибелердің нәтижелері
бұл мәселенің шешімі ойлағандай оңай табылмайтынын байқатты.
Солай бола тұра, атқарылған жұмыстар тек машиналық
аударма аясындағы зерттеулерге ғана емес, сонымен бірге ғылыми
ізденушілерді тілдің теориялық және құрылымдық жағына да
көңіл аударуға ынталандырды.
Қорыта айтқанда, автоматты аударманың бірінші кезеңі белгілі
дәрежеде айтарлықтай нәтижелі болды. Себебі, аталған кезеңде
көптеген іргелі мәселелердің бастамасы анықталып, зерттеудің
болашағы сараланып, жолдары айқындалды. Мысалы, автоматты
сөздіктерді құрастыру, аралық-тілді құрастыру, сөздердің
омонимдік сипаты мен синтаксистік құрылымы, яғни сөздердің
сөйлемдегі тіркесімі, фразеологизмдердің жасалу жолдары және
көптеген басқа да мәселелердің сыр-сипаттары анықталды.
Осы мезгілдерде, бүгінгі таңда да аса маңызды деп саналатын,
синтаксистік талдаудың алгоритмінің алғашқы нұсқалары
зерттелді: синтаксистік тәуелділік пен тікелей құрастырушыларды,
болжамдық талдауды, көпнұсқалы синтаксистік талдауды,
«фулькрумдер» әдісімен талдауды, конфигурациялық талдауды
және т.б. әдіс-тәсілдерді ескере отырып, талдау жүргізу жақтары
қарастырылды.
Терминтану саласындағы бағыныңқылықтың моделі мен
тікелей құрастырушылардың моделін талдаудан толық сөйлемнің
құрылымдық байласымын анықтауға болатындығы байқалды.
Мұндай құрылымның көпмағыналығының басын ашып алу үшін
әртүрлі «сүзгілердің» әдістері қолданылады (қара: ЛМУ-дың
математикалық лингвистика зертханасындағы С.Я.Фитиалов пен
Г.С.Цейтиннің жетекшілік етулерімен жүргізілген жұмыстар;
GETA атты Гренобльдық топ – Centre d’études pour la tradution

101
autmatigue, жетекшісі В.Вокуа). «Күшті» сүзгі ретінде Д.Е.Хейстің
байланыс «күші» ұғымы ұсынылды (The Rand Corporation
Automatic Language Data Processing Croup. Santa Monica (Calif.))
[30].
Болжамдық талдау сөздік мақаланың айрықша құрылымына
негізделеді (Национальное бюро стандартов США, И.Родес;
Вычислительная лаборатория Гарвардского университета (Масс.),
рук. А.Эттингер). Мұнда әрбір сөзге оның барлық байланыс
мүмкіндігі жайлы ақпарат тіркеледі. Талдау тәртібі (процедурасы)
мәтінді солдан оңға қарай тексеріп шығу тәсілі бойынша жүргізіледі.
Осының нәтижесінде әрбір кезекті сөздің «өлшемінің» алдыңғы
сөз бойынша жасалған болжамға сай келетіндігі тексеріледі. Егер
ол жасалған болжамға сай келмесе, ондай сәйкестікті іздестіру сол
жаққа қарай ауысады. И.Родестің ғылыми тобында бірварианттық
талдау қарастырылады, яғни талдауға түскен сөздің сол жағында
орналасқан бірінші сөз сәйкестік «иесі» деп саналып, кез келген
сөйлемге тек бір ғана синтаксистік құрылым сәйкес қойылады.
Сөйлемнің синтаксистік құрылымының бірнеше нұсқаларын
есепке алуға мүмкіндік туғызатын көпнұсқалық талдауды бір
қадам алға басу деп санауға болады (С.Куно, А.Эттингер, Гарвард
университетінің Есептеу зертханасы). Көпнұсқалылық талдауда
сөздің синтаксистік потенциалды мүмкіндіктерінің молдығының
арқасында синтаксистік байланыста тұратын сөздерге болжам
жасауға болатындығы негізге алынады. Көпнұсқалылық
талдаудың алғашқы грамматикасы 2100 ереже мен 82 синтаксистік
болжамды қамтыды. Сөйлем құрылымының диаграммасы тікелей
құрастырушылар моделі негізінде құрылды. Осының нәтижесінде
мүмкін болатын барлық варианттар іріктеліп, олардың көпшілігі
әртүрлі сүзгілер көмегімен сан жағынан шағындалды. Болжамдық
талдау алгоритмінде көпнұсқалы фразаның синтаксистік
құрылымына тән екімәнділік ақиқаттығынан гөрі, оны таңдалып
алынған нұсқаларды іріктеу әрекетінің формалды сипатының
салдары деуге болады. Міне, бұл жүйелердің осалдығы да осында.
Дегенмен, синтаксистік болжам жайлы идеяның өзі де құнды
деуге болады. Бұл ой-пікірге қазіргі кездегі кейбір грамматикалық
болжамдарға сүйенетін автоматты талдау жүйелері негізделуде
[31; 32].

102
Атап айтуға тұратын жайт – бірнұсқалылық пен көпнұсқалылық
талдауларды бір-біріне қарсы қою машиналық аударманың
қалыптасуының бірінші кезеңі үшін ерекше маңызды болуы.
Бірнұсқалылық талдауда кездейсоқтыққа жақын дәрежеде
таңдалып алынған сөйлем құрылымы дұрыс болмай шығуы
мүмкін, ал талдау жұмысын басынан қайталау мүмкіндігі бұл
жүйелерде алдын ала қарастырылмаған. Көпнұсқалық талдауда
біркелкіліктің бұзылу қаупі бар: құрастырылған құрылымдардың
саны нұсқаны дұрыс таңдау мүмкіндігінен де айтарлықтай үлкен
болуы мүмкін.
Сонымен бірге жақсы аудармашы (немесе автоматты аударма
жүйесі) мәтін мазмұнын түсіну үшін аударуға тиісті фразаның
дұрыс түрдегі бір ғана нұсқасын ұсынуы керек. Ал фразалардың
көпмағыналығы мәнмәтін бойынша өз шешімін табатыны
белгілі, сондықтан сөйлемдердің нақты мағыналарын ажырату
мәселесі мәтінде баяндалатын ақиқат жағдаятқа қатысты толық
мәтіннің синтаксистік және семантикалық заңдылықтарына
тікелей байланысты болып келеді. Мұндай семантикалық
мәліметтер машиналық аударманың бірінші және екінші
кезеңдерінде үзінділер түрінде ғана көрініс тауып, толығымен
қолданыла қоймады. Себебі, машиналық аударма жүйесін тиісті
лингвистикалық мәліметтермен жабдықтау ісі әлі де болса толық
зерттелмеген болатын.

жүктеу/скачать 2,17 Mb.

Достарыңызбен бөлісу:

1 ... 31 32 33 34 35 36 37 38 ... 103