321
1) http :/ / www.statmt.org/moses/?n=Moses.LinksToCorpora
2) http :/ / mokk.bme.hu / ресурсы / hunalign /
3) http :/ / code.google.com [6].
Moses декодері модульдік қағидат бойынша жазылады және пайдаланушыға
кодсыздандыру процесін төмендегідей тәсілдермен өңдеуге мүмкіндік береді:
? Кіру: Бұл аударма процесін қалай орындау қажеттігін сипаттайтын XML-элементі бар
аннотация немесе желінің торы немесе «шытырманы» сияқты күрделі құрылым (мысалы,
сөзді тану) болуы мүмкін.
? Үлгінің аудармасы: Бұл сөзбе-сөз немесе иерархиялық (синтаксистік) ережелерді аудару
болып табылады.
? Алгоритмді расшифровкалау: кодсыздандыруда іздеу барысындағы «сәйкестіктердің»
өте көп болуы қиындық тудыратындықтан, Moses мұндай іздеу үшін stackbased, талдау
(разбор) графигі және т.б. сияқты әртүрлі бірнеше стратегиялық тәсілдерді қолданады.
? Тілдік Модель: Moses бағдарламасында SRILM, KenLM, IRSTLM, RandLM сияқты
әртүрлі бірнеше тілдік модельдер құрал-саймандарын пайдалануға болады.
? Moses серверлер: декодерге арналған XML-RPC интерфейсін қамтамасыз етеді.
? Веб-трансляция: Moses веб-беттерді аудару үшін пайдаланылатын скриптер жиынтығы.
? Құрал-саймандарды талдау: Moses шығыстарын талдауға және визуалдауға арналған
сценарийлер.
Moses бағдарламасында машиналық аударманы адам редакциялауы үшін FirstPass ретінде
пост-редакциялау жүргізіледі. Бұл аударманың уақытын (тиісінше жалпы құнын) азайтуы
мүмкін. Автоматтандырылған аудармада SMT қолданылуы да мүмкін, алайда қазіргі кезде
(2012 жылдың сәуірінен бастап) әрі қарай тереңдей зерттелу үстінде, жуырда ЕС, Casmacat10
және MateCat11 жобалары іске қосылды.
Moses арқылы дайындалған әзірлеменің негізгі платформасы Linux Moses болып
табылады. Алайда Moses басқа платформалармен де жұмыс істейді. Мысалы, Moses
бағдарламасы Windows-те Cygwin арқылы жұмыс істеуі, Moses әзірлеушілері OSX
қондырғысын да пайдалануы мүмкін.
Moses маузер және бірлескен автор (2009) ұсынған ауқымды лексика моделін
пайдаланады, алайда әрбір тұтас сөзді үйрету мүмкіндігі баяу жүреді.
Moses бағдарламасында жалпы алғанда көптеген грамматикалық ережелер қамтылған.
Алайда иерархиялық жүктеуге арналған ережелер кестесі жадында декодер өте баяу жұмыс
істейді және жедел (оперативті) жадты көп пайдаланады. Мұндай ережелердің кейбіреулері
үшін CKY арқылы іске асырылған кодсыздау алгоритмі оңтайлы болып табылмайды.
Сондықтан бөлініп алынған модельдерді іздеуге арналған алгоритмдерді пайдалану немесе
балама нұсқаларды зерттеуге аса көңіл бөлу керек.
Автоматты аударма жасау бағдарламаларына
жаңа қызметтерді қосу қазіргі кезде 2009
Достарыңызбен бөлісу: