SMART Boards in General
Take a look at the video link to SMART boards in the previous section. See how fast and easy things are with
SMART boards? One can write on the SMART board, save it, start a new page of notes, then take a screenshot of an
Excel spreadsheet without missing a beat. It would not take very long to create lessons or lesson plans if one had a
SMART board. The quickness of SMART boards makes them a great tool for educators, students, and everyone else.
Some problems using YouTube in a classroom:
Students aren't able to get the proper practice learning the language as they would if they were practicing with
someone in person.
Students aren't able to know if they are making mistakes when they are practicing their phonics.
Some information on the YouTube video may not be completely accurate.
YouTube has been criticized for failing to ensure that uploaded videos comply with copyright laws.
Some students don't have access to internet outside of school. As an educator, ensuring that all students have
access to complete assignments is crucial to student success.
Some schools have YouTube blocked, saying that it violates student's safety, so in some institutes teachers and
students would not be able to access YouTube in the schools, though the teacher can send a request to have it
unblocked during certain times of the day. Also there is a website, www.keepvid.com, where you can download the
YouTube video to your computer, save if on a flash drive and bring it to class to show since it technically isn't pulling
anymore from the website.
Disconnection-some users become disconnected.
Privacy- any time that students and educators are using the internet, it is important to ensure safety by checking that
privacy settings are on.
Although there are many benefits to using Skype in the classroom, educators should be aware of some of the
issues the technology currently faces. By testing the software prior to class time, teachers can deal with these issues.
Some users, particularly Mac users, experience difficulty logging in. The company is currently working on this
issue, but it continues to plague users at this time.
Some users have experienced difficulty with the video aspect of Skype. Depending on the type of webcam, it
may not connect to Skype software
Some users experience issues with sound. The most common issues that users experience are echoes and feedback.
Some users become disconnected mid-conversation and have to re-connect.
Any time that students and educators are using the internet, it is important to ensure safety by checking that privacy
settings are on.
Not all students have access to computers and internet at home. As an educator, ensuring that all students have
access to complete assignments is crucial to student success. If the student does not have the materials at home, the
teacher should make other arrangements.
There are also many problems facing SMART boards in foreign language classrooms. In fact, there are some problems
facing the introduction of Smart boards in any classroom.
First and foremost, cost is an issue facing SMART boards in any education class. SMART boards can cost
anywhere between $1000 and $5000, which could be a problem if one wanted to introduce the technology to an entire
foreign language department, much less to an entire school. With budget cuts terrorizing the nations middle and high
schools, introducing SMART boards could simply be an impossibility or an improbability. Second, it would take some time
and resources to train teachers how to use SMART boards. If the technology is not used properly or effectively, it may
just as well not be used at all. Some teachers do not believe that SMART boards are necessary, and therefore will not be
motivated to take the time to learn how to use it. This is a problem facing SMART boards, because if a school is
considering integrating SMART boards in classrooms, the administration will most likely take teacher interest into
account. Finally, SMART boards are electronic items and are therefore sensitive. In a school environment, where the
pace is fast and children are present, this could be dangerous and/or costly. Also, teachers and students must know how
to properly maintain SMART boards if they are to last a long time (and thus cut down on costs). All of these problems
facing SMART boards could prove to be devastating to their introduction into schools. If the administration/teachers
have never seen SMART boards in action, they may not think it a necessary cost/risk to introduce them into their school.
244
Reference
1. Jacobson R., Fang G., Hale M. // Internet. Google.com.nur.kz
2. Donnelly, R. (2004a) “ Online Learning in Teacher Education : Enhanced with a Problem – based Learning Approach.“
AACEJ, Issue 3.
3. Donnelly, R. (2004a) “ The Effectiveness of Teaching ‘ Online Learning’ in a Problem
4. Encyclopedia of international Computer – based Learning, 1 – 9.
5. Gagne, R. (1985) The Conditions of Learning. 4
th
ed. New York: Holt, Rinehart & Winston.
УДК 681.03
ОСНОВНЫЕ ПРОБЛЕМЫ СОЗДАНИЯ МАШИННОГО ПЕРЕВОДЧИКА ДЛЯ
БЛИЗКОРОДСТВЕННЫХ ЯЗЫКОВ И ПУТИ ИХ РЕШЕНИЯ
Назиров Ш. А., Рахманов К.С., Махмудов А.З.
Ташкентский университет информационных технологий, Ташкент, raxmanov@gmail.com
В настоящие время, в связи с углублением процесса глобализации в мировом сообществе, происходит
взаимопроникновение культур разных народов. В связи с этим необходимы знания разных языков для того, чтобы
изучать культуру, литературу, экономику, технологии и достижения в науке того народа. Для быстрого изучения
языка требуется создание электронного переводчика, предназначенного для перевода с одного языка на другой.
Конечно перевод - это творческий процесс, так как один и тот же текст разные переводчики переводят по-
разному. Но, в последнее время, положение резко изменилось. С появлением развитых средств, методов и
подходов компьютерной лингвистики процесс перевода можно формализовать [1-8]. Если задачу сузить, только
рассматривать близкородственные языки, то задача облегчается больше [9].
Например, рассмотрим тюркские языки. На сегодняшней день существует 30 тюркских языков, из них 23
считаются действующими (узбекский, турецкий, азербайджанский, туркменский, гагаузский, крымско-татарский,
карачаево-балкарский, кумыкский, ногайский, караимский, татарский, башкирский, ойротский, шорский,
хакасский (с диалектами согайским, бельтирским, качинским, койбальским, кызыльским, шорским), тувинский,
якутский, долганский, казахский, киргизский, каракалпакский, уйгурский (новоуйгурский), чувашский (потомок
языка камских булгар)), а 7 мертвых языков (орхонский, печенежский, половецкий, древнеуйгурский,
чагатайский, булгарский, хазарский). Отсюда следует, что тюркские языки составляют большую группу языков,
на которых говорят многомиллионные тюркские народы, из истории известно, что велика роль в мировой
истории тюркских династий, что тюркские народы имеют самобытную культуру, литературу, науку и др. Поэтому
создание электронного переводчика для тюркских языков является одним из важнейших задач современности.
Задачи перевода можно поставить по-разному суть, которых описана ниже.
1. Перевод с узбекского языка на другие тюркские языки. Эту задачу можно представить в виде схемы:
Рис. 1. Схема перевода с узбекского языка на другие тюркские языки
Для создания машинного переводчика, сначала нужно определить словари: узбекско-уйгурский,
узбекско-каракалпакский, узбекско-казахский, … , узбекско-чувашский. На сегодняшний день таких словарей
отсутствуют, поэтому для решения поставленной задачи можно использовать словари, переводящие с русского
на тюркские языки.
Кроме того, здесь огромную роль играет алфавит. Например, в турецком, узбекском, азербайджанском
языках принят латинский алфавит. А остальные тюркские языки бывшего союза используют кириллицу (хотя на
сегодняшний день рассматривается вопрос перехода на латыни казахского, татарского, башкирского и др. языков
Чувашский
Башкирский
Татарский
Киргизский
Турецкий
Туркменский
Азербайджанский
Казахский
Уйгурский
Каракалпакский
Узбекский
.........................
245
[9]). Более того, узбекский и азербайджанский языки до приобретения независимости использовали кириллицу. В
уйгурском языке используется арабский алфавит. Для решения задачи 1 необходимо учесть вышесказанное.
2. Нужно ставить следующую задачу:
узбекский→уйгурский→каракалпакский→казахский→татарский→
киргизский→башкирский→туркменский→азербайджанский→турецкий→…→чувашский→ узбекский.
Результат по такой схеме машинного перевода нельзя предсказать, так как при переводе с одного языка
на другой смысл теряется.
2.
Необходимо ставить задачу переводите с любого тюркского языка на любой другой тюркский язык. Для
решения данной задачи необходимо назначить один из тюркских языков базовым и через него осуществлять
перевод (рис. 2).
Рис.2. Схема перевода с одного тюркского языка на другой
Здесь нужно учесть, что существуют двуязычные машинные переводчики, как: узбекско-уйгурский
(уйгурско-узбекский), узбекско-каракалпакский (каракалпакско-узбекский), ... , узбекско-чувашский (чувашско-
узбекский). Например, если требуется перевод с татарского на каракалпакский, то согласно рис. 2, схема
трансляции перевода можно представить в виде:
татарский→узбекский→каракалпакский
Система перевода между близкородственными языками строится на основе прагматически-
ориентированного подхода к разработке лингвистических моделей [9]. Прагматически-ориентированный подход
позволяет более детально прорабатывать модели определенного языкового уровня в зависимости от целевой
ориентированности разрабатываемой cистемы и определять минимальный набор средств для решения
определенного круга лингвистических задач. Эффективность системы перевода, разрабатываемая на основе
такого подхода, может быть обеспечена на уровне формирования лингвистических моделей разного уровня за
счет учета близости структурных и типовых характеристик языков внутри одной языковой группы.
Языки внутри одной тюркской языковой группы, в число которых входят узбекский, уйгурский,
каракалпакский, азербайджанский, татарский, казахский и турецкий языки, обладают большим сходством на всех
языковых уровнях. Поэтому в работе[9] выдвинута гипотеза, что при разработке систем перевода внутри
тюркских языков основную часть перевода будут обеспечивать лингвистические модели морфологического и
морфосинтаксического уровней. Исходя из этой гипотезы и в соответствии с прагматически-ориентированным
подходом, в работе [9] предложена общая архитектура системы машинного перевода (СМП) которая
представлена на рис.3.
Рис.3. Общая архитектура работы СМП для близкородственных языков
246
Как правило, благодаря практической идентичности синтаксической структуры предложений (отсюда
следует, что для близкородственных языков нет необходимости синтаксического анализа предложений), при
переводе между близкородственными языками имеющиеся неоднозначности в исходном тексте в том же виде
переходят в переводной текст на другом языке. Такая же ситуация со словоформами, в которых имеет место
совпадение многозначности в корневых и аффиксальных морфемах.
На рис. 3 под компонентом графематического анализа понимается выделения слов, цифр, формул и т.д., а
под компонентом морфологического анализа – построение морфологической интерпретации слов входного
языка, под компонентом морфонология (от греч. morphe – форма + phoni – звук + logos – учение) понимается
раздел языкознания, изучающий связи морфологии и фонетики (выражение морфологических изменений путем
использования фонологических средств, выявление фонемного состава морфем и слов и т. д.).
Следующей проблемой является создание лингвистических ресурсов для близкородственных языков.
Для решения задачи создания переводчика требуется большое количество лингвистических ресурсов,
соответственно, необходимо произвести анализ имеющегося на сегодня материала, готового для использования
в проекте. Анализ показал, что для использования в задачах перевода между узбекским и другими тюркскими
языками в настоящее время реально доступны только турецкий-азарбайджанский-башкирдский-казахский-
киргизский-узбекский-татарский-туркменский-уйгурский-русский словари с объемом около 10 000 словарных
статей[10]. Вместе с тем, даже эти словари, изданные в бумажном виде, не представлены в Интернете в
электронном виде. Из этого следует, что необходимо активизировать работу по созданию многоязычного словаря
тюркских языков.
Авторами работы [9] предложена структура многоязычного словаря, в соответствии с которой словарь
должен содержать в себе не только лексическую, но и морфологическую информацию (рис.4).
Рис.4. Архитектура базы данных с многоязычным словарем
Согласно этой модели база данных состоит из N взаимосвязанных компонент для каждого из
используемых языков. Каждая из компонент имеет независимую структуру, обусловленную языковой
спецификой. Компоненты связаны между собой на уровне лексических эквивалентов семантического кода и
морфологических категорий.
Компонент для каждого языка содержит как лексическую, так и морфологическую информацию. Это
сделано с целью оптимизации поиска в базе данных, чтобы в одном словаре базы данных производить поиск
требуемого компонента только один раз, одновременно вытаскивая из него как морфологическую информацию,
так и информацию о лексических эквивалентах найденной лексемы.
Следующим лингвистическим ресурсом являются словари окончаний для каждого из этих языков.
Процесс создания словарей окончаний состоит из двух этапов:
Сравнительный анализ аффиксальных морфем (от греч. morphe – форма, т.е. значимая часть слова, далее
неделимая), используемых тюркских языков;
Определение морфонологических типов.
Сравнительный анализ морфологических категорий узбекского, каракалпакского, татарского, казахского
и турецкого и др. тюрских языков показал, что для именных конструкций системы морфологических категорий
во всех этих языках очень близки и основная масса морфологических категорий и выражающих их аффиксальных
морфем полностью совпадают. Между ними существует только морфонологическая разница, как, например,
количество алломорфов (от греч. allos – другой + morphe – форма, т.е. тоже, что вариант морфемы)
аффиксальных морфем. Есть только небольшие различия, как, например, наличие инструментального падежа в
247
казахском и турецком языках, выражаемого с помощью аффикса, а в татарском языке аналогичная категория
выражается с помощью послелогов.
Основное различие между морфологическими категориями узбекского, уйгурского, каракалпакского,
татарского, казахского, турецкого и других тюркских языков заключается в глагольных категориях, которые
следует тщательно анализировать.
Отметим, что тюркские языки, в свою очередь, делятся на 4 группы: карлукские (узбекский, уйгурский),
огузский (турецкий, азербайджанский, туркменский, гагаузский и др.), кипчакские (казахский, киргизский,
татарский, башкирский, ногайский, каракалпакский, балкарский и др.), чувашский. Отметим, что при переводе с
одного языка на другой внутри групп, качество перевода намного улучшается, так как существующие здесь
проблемы перевода с одного языка на другой, начиная с лингвистических ресурсов и заканчивая проблемой
синонимов, автоматически разрешаются. Например, рассмотрим карлукскую группу тюркских языков. Известно,
что к этой группе основном относятся узбекский и уйгурский языки. Эти языки так близки, только они отличаются
с точки зрения фонетики. Остальные конструкции этих языков почти идентичны, поэтому точность электронного
перевода с узбекского на уйгурский (аналогично с уйгурского на узбекский) будет достаточно высокой.
Выше указанная проблема относится и к другим близкородственным языкам, например, славянским,
германским, романским, иранским и др. языкам.
Теперь обобщим выше описанные проблемы путем формализации.
4. Для близкородственных языков здесь следует ставить следующую задачу: перевод с одного
близкородственного языка на остальные (рис.5.).
Рис.5. Формализация схемы перевода с одного близкородственного языков на другие близкородственные языки
где i=
1, n
,
i
k
L
- языки, относящиеся к группе близкородственных языков.
Здесь также, как и в задаче 1, необходимо изучить проблемы алфавита, словари, синонимы, омонимы, проблемы
лингвистических ресурсов и так далее. Данную задачу можно представить в виде:
1
2
...........
i
i
i
n
k
k
k
k
k
k
L
L
L
L
L
L
(1)
Схема(1) отражает двуязычные электронные переводчики.
5. Задачу 2 можно обобщить в виде
1
2
...
i
n
i
k
k
k
k
k
L
L
L
L
L
(2)
Здесь
i
k
может принимать одно из значений
1
2
1
1
{ ,
,
,
,...,
}
i
i
n
k k k
k
k
Реализовать схему (2), достаточно сложно. Ясно, что при таком подходе точность перевода намного
уменьшается.
6. Задачу 3, можно обобщить по следующей схеме:
L
i
k
L
1
k
L
2
k
L
3
k
L
.
.
n
k
L
248
i
k
L
1
k
L
2
k
L
3
k
L
j
k
L
s
k
L
n
k
L
Рис.5. Формальная схема перевода с одного близкородственного языка на другой.
Близкородственные языки могут делиться на подгруппы (наподобие тюркских языков). Поэтому
1
2
1
2
,
,...,
s
B
B
B
B
s
L
L
L
L
где
1
2
,
,...,
i
i
i
B
B
B
B
i
i
i
ik
L
L
L
L
Наподобие тюркских языков, точность перевода внутри каждого
B
i
L
будет высокой. Пусть
i
A
и
j
B
языки, относящиеся к одному из языков внутри подгрупп близкородственных языков, тогда
:
1
i
j
i
j
A
A
A
B
(3)
Это означает, что внутри подгрупп близкородственных языков, с точки зрения грамматики, словоформ и
омонимов, синонимов, морфологических основ и окончаний и т.д. друг другу достаточно близки.
Конечно, внутри близкородственных (не внутри подгрупп близкородственных языков) получить оценку
типа (3) задача сложная. В этом случае правая часть соотношения (3) может не принимать значения равные
единице, а 0.9, 0.8, 0.7 , тогда при машинном переводе детально анализировать все морфокатегории. Если
перевод с одного языка на другой будет не близкородственным, тогда значения правой части соотношения (3)
будет гораздо меньше чем единица, например: 0.05, 0.06, 3., 0.1, 0.2 и т.д. Тогда, на основе математической
модели этих языков процесс перевода необходимо осуществить по следующей схеме:
графематический анализ →морфологический анализ → синтаксический анализ→ семантический анализ.
Кроме того, здесь существует много проблем: проблема омонимов, синонимов, полнота лингвистических
ресурсов и т.д. Далее следует отметить следующее: Допустим между двумя достаточно дальнородственными
языками существует (разработан) машинный переводчик и пусть результат машинного перевода будет
достаточно высоким. Например, между английским и узбекским языками разработан подобный переводчик. Тогда
этот результат надо использовать при переводе с английского языка и для других тюркских языков. Так, если
требуется перевод с каракалпакского языка на английский, то следует использовать следующую схему перевода.
каракалпакский → узбекский→ английский.
Так как внутри близкородственных языков точность перевода будет достаточно высокой, то мы
сэкономим время и средства, необходимые для перевода.
В настоящее время по схеме рис. (2) и (4)-(5) нами разработаны следующие двуязычные электронные
словари: узбекско-уйгурский, узбекско-азербайджанский, узбекско-туркменский, узбекско-казахский, узбекско-
татарский. Разработан двуязычный узбекско-каракалпакский (каракалпакско-узбекский) машинный переводчик.
Следующей задачей является создание электронного переводчика для всех тюркских языков.
Достарыңызбен бөлісу: |