2. Лингвистический аспект
В данном разделе статьи осуществляется анализ татарского алфавита на основе латинской
графики из 34 букв, утвержденного Указом Президента РТ и признанного в настоящее время
экспериментальным вариантом, и предлагается новый вариант алфавита, состоящий из 26
букв.
В ряде писем в Академию наук Республики Татарстан и Комиссию по реализации
языковой политики в компьютерных технологиях Комитета по реализации Закона «О языках
народов РТ» при Кабинете Министров Республики Татарстан их авторами предлагалось
использовать для отображения татарских букв только латинские буквы английского
алфавита, а специфические татарские фонемы обозначать в виде сочетания латинских букв
(например, как немецкие ‘Ш’ –‘ Sch’ и ‘Ч’ – ‘Tsch’, английские ‘Ч’ – ‘Ch’, ‘Х’ – ‘Kh’).
Некоторые специалисты, учитывая закон сингармонизма гласных в татарском языке
предложили специфические мягкие гласные отображать комбинацией букв - через твердые
гласные плюс какая-либо буква или символ, обозначающие смягчение твердой гласной
(например, ‘Av’ или ‘Ae’, или ‘Ah’, или ‘A`’ вместо татарской буквы ‘Ә’). Считая такое
предложение достойным внимания, мы провели анализ и пришли к следующему выводу.
Специфические согласные буквы из нового алфавита: ‘Ч’, ‘Ң’, ‘Ш’, ‘Ж’, действительно,
84
возможно отображать в виде комбинации латинских букв. Причем, для их обозначения
второй буквой в качестве оператора можно использовать английскую букву ‘h’, по аналогии
с принятой нормой в ряде языков на латинической основе (немецкий, английский) и
достаточно редко встречающуюся в сочетаниях с согласными в татарских словах. Таким
образом мы получаем следующие обозначения фонем: ‘Ч’ –‘Ch’, ‘Ң’ –‘Nh’,’Ш’ –‘Sh’, ‘Ж’ –
‘Zh’, являющиеся достаточно естественными и с точки зрения общепринятых норм
написания. В этом ряду вне рассмотрения остается буква ‘Җ’, которую можно было бы
оставить в том же виде, как и в принятом алфавите – ‘C’. Вместе с тем, для фонемы ‘Җ’
возможно ввести следующую комбинацию букв: ‘Jh’. Тогда буквой ‘C’ можно обозначить
фонему ‘Ц’, которая в новом алфавите передается сочетанием букв ‘Ts’, или фонему ‘Ч’,
которая гораздо более частотная для татарского языка (сравните: коэффициент частотности
‘Ч’ – 0,015, а фонемы ‘Ц’ – 0,0004). В том случае, когда ‘Jh’ передает звук ‘Җ’, буква 'J’, во
изменение нового алфавита, обозначает фонему ‘Й’ (‘и’ краткое). Соответственно,
освобождается буква Y, которая традиционно обозначает букву ‘Ы’, например, как в слове
‘KRYM’, тем самым появляется хорошая возможность освободиться от целого узла
неприятностей написания татарских букв ‘Ы’ и ‘И’, вернув для ‘И’ обычное написание,
принятое в классическом латинском алфавите – ‘I’, а ‘Ы’ обозначив как ‘Y’. Эти буквы в
новом алфавите отображены ‘İ ’ (‘I’ с точкой или «палка с точкой») и ‘I’ (‘I’ без точки или
«палка без точки»), соответственно, и порождают массу неприятностей (особенно при
разработке шрифтов и их распознавании, путаница с заглавной буквой ‘И’ в татарском и
английском алфавитах, сложности в компьютерных технологиях и др.).
Далее рассмотрим такие одиозные буквы, за которые чуть ли не сердцем цепляются
некоторые филологи – это твердые варианты букв ‘Г’ и ‘К’. Они введены в новый алфавит и
обозначены буквами Ğ - ‘G’ с ижицей (“галочкой”) и ‘Q’. Во-первых, создается прецедент,
когда в алфавит вводятся пары согласных по принципу: «мягкий-твердый». Из истории
хорошо известно, что у татар уже был такой алфавит – рунический, где все согласные были
парные: «твердые-мягкие». Однако в настоящее время такой возврат, тем более, в
нескольких буквах, не является обоснованным, так как твердость и мягкость татарских
согласных в настоящее время однозначно определяется по закону сингармонизма, по
мягкости-твердости контекста из гласных букв. Вместо того чтобы установить приоритет
закона сингармонизма родного языка, вводя мягкие и твердые пары для букв ‘Г’ и ‘К’, мы
сознательно идем на его нарушение, то есть отвергаем правила татарского языка только
ради закрепления произношения, пришедшего из другого языка с его фонетическим рядом и
ставшего близким нашему слуху (читай: слуху некоторых филологов). Введение твердых ‘Г’
и ‘К’ многократно усложняет разработку автоматического конвертора татарских текстов с
татарской кириллицы на латиницу, требуя различать в тексте заимствованные и родные для
татар слова (что, я думаю, будет не просто не только для машины, но и для носителей
языка), а в некоторых случаях делает ее практически невозможной без обращения к смыслу
предложения. Скажем, как можно было бы, даже прекрасно зная татарский язык, перевести
с кириллицы на латиницу следующий текст: канатка канат сукты? Возможны 4 варианта:
kanatqa kanat suqtı (‘канат ударил по канату’), qanatqa kanat suqtı (‘по крылу ударил канат’),
qanatqa qanat suqtı (‘по крылу ударило крыло’), kanatqa qanat suqtı (‘по канату ударило
крыло’), и все они верны с точки зрения языка.
Резюмируя сказанное, нами предлагается в новом алфавите оставить только варианты
графем K, G, и пусть закон сингармонизма решает их морфонологию. Путаницы будет
меньше, чем когда мы искусственно пытаемся внести порядок.
Такая путаница ожидает нас и с буквами ‘V’ и ‘W’. Фамилия 'Василов’ должна
конвертироваться как ‘Wasilov’, а 'Васильев' – как ‘Vasil’ev’. Пытаясь уйти от одной
сложности, мы порождаем другую, когда изучающий татарский язык, или даже носитель
языка, всегда должен помнить, не является ли слово заимствованным. Это слово уже
никогда не станет ему родным, за этим будет следить специальное правило. Лучшим
выходом из этой ситуации было бы обогащение татарского языка новым словом через его
85
фонетическую ассимиляцию, отменив странное правило, когда заимствованные слова
склоняются иначе, чем «родные», и они должны «помнить», что они «чужие».
Буква ‘W’ одна вполне справится с отображением фонемы ‘В’. Даже использование
только буквы ‘V’ – прямого фонетического аналога кириллической буквы ‘В’ будет менее
проблематично (во всяком случае, с точки зрения татарского языка). Во всяком случае,
сложностей будет гораздо меньше, чем при одновременном использовании ‘V ‘и ‘W’.
Такая же ситуация с буквами ‘X’ и ‘H’. Даже носитель языка, хорошо владеющий
татарским языком, зачастую не знает когда писать ту, и когда другую буквы – настолько в
речи они схожи. ‘X’, как правило, смягчается, а ‘H’ произносится чуть тверже, чем при
отдельном алфавитном произношении. В речи они практически сливаются.
Очевидный выход – положиться на тот же закон сингармонизма, оставить только ‘H’,
исключив ‘X’. Тогда, например, получаем следующее написание слов: ‘hat’, ‘hәrhәldә’
(сегодня литературные варианты: хат, һәрхәлдә). Именно вариант ‘h’ и выбран нами для
включения в алфавит на основе латиницы, предлагаемого в данной статье. Вместе с тем,
имеется очевидный аргумент против использования в латиническом татарском алфавите
буквы ‘Х’. На латинице эта буква используется для обозначения фонемы ‘КS’, а не 'ХА’, как
в новом алфавите, принятом Законом Татарстана. То есть, включая букву ‘Х’ в алфавит,
заранее готовим себе те же грабли - за одной и той же графемой уже в новом алфавите
закрепляются две совершенно разные фонемы. В то же время известно, что в латинических
алфавитах, как правило, фонема ‘Х’ обозначается комбинацией двух букв: ‘KH’, скажем,
‘Bukharaev’,‘Sakhibullin’, ‘Khayrullov’. Таким образом, получается, что фонема ‘Х’ из
татарского кириллического алфавита переносится в новый алфавит на основе латиницы под
той же «крышей», закрепив новую путаницу с фонемами. В такой ситуации очевидно, что
букву ‘Х’ лучше не использовать в новом алфавите, а при необходимости (скажем, если
даже и отображать данный аллофон в языке графически) для отображения фонемы ‘Х’ в
латиническом написании использовать комбинацию букв: ‘Kh’
Переходя к гласным буквам, можно с уверенностью утверждать, что принцип
отображения их комбинацией букв, или с использованием оператора мягкости или
твердости здесь не проходит. Это прежде всего потому, что гласные буквы в татарском
языке очень мобильны и они сами одновременно играют роль операторов мягкости или
твердости. В отличие английского языка, имеющего главным образом корневое изменение и
очень слабое аффиксальное, татарский язык, является агглютинативным языком, в котором
к корню могут присоединяться аффиксальные морфемы (потенциально - без ограничений), в
которых очень активны гласные фонемы. Словоформа, образованная присоединением к
корню даже двух-трех аффиксов с фонемами (а это практически норма для языка),
составленными по формуле «буква+оператор», становиться практически нечитабельной. В
этом легко убедиться на простом примере: ‘kuhbahlahklahrgah’. Это простое слово
‘күбәләкләргә - бабочкам’ образовано с использованием смягчающего оператора ‘h’.
Использование других символов тоже не разрешает ситуацию: ‘kuvbavlavklavrgav’,’
kuebaelaeklaergae’,’ ku`ba`la`kla`rga`’. Очевидно, что с татарскими гласными ни вариант
комбинации букв, ни применение оператора не являются приемлемыми. В английском
алфавите, хотя и имеются схожие фонемы, они передаются не графемой, а сочетанием букв,
причем, не всегда одинаковым. Таким образом, использование специфических графем
оказывается единственно приемлемым вариантом. Начертание мягких гласных можно
оставить такими, как они приведены в новом алфавите ('а’ – ’ә’, ’u’ – ’ü’ (‘u’ умляут), ’o’ –
’ө’), однако более прогрессивным и удобным с точки зрения технологий представляется
унифицированный вариант пар гласных букв: ‘а’ – ‘ä’ (‘а’ умляут), ‘u’ – ‘ü’ (‘u’ умляут), ‘o’
– ‘ö’ (‘o’ умляут). Вполне приемлемо для татарского языка (как это имеет место и в
алфавитах других языков, скажем, буква I в английском алфавите), когда рукописные и
наборные начертания мягких гласных различаются, поддерживая в рукописном варианте
“прошлый” привычный образ гласных фонем (привычный - без “рожков и двоеточий”). В
этом консерватизме, похоже, есть нечто стабилизирующее, связующее и обеспечивающее
86
некое смягчение перехода на новый алфавит, возможно, связанное с тонким телом, с кодом
нации. В таком случае в алфавите в качестве примера рукописного варианта будут
фигурировать пары мягких гласных: ‘Әә’, ‘Ää’; ‘Өө’,’Öö’;‘Үү’, ‘Üü’.
Ниже представлены таблицы с вариантами татарского алфавита на основе латиницы,
состоящего из 26 букв, предлагаемыми автором статьи. Нами разработаны 3 варианта
алфавита, различающиеся только лесико-графической упорядоченностью (ЛГУ) на основе
различных принципов.
Вариант 1 - порядок графем скоординирован с порядком соответствующих графем
алфавита английского языка (то есть на основе ЛГУ английского алфавита).
Вариант 2 - тот же алфавит по варианту 1 упорядочен (уточнен) дополнительно таким
образом, что графемы сгруппированы по принципу фонемной близости.
Вариант 3 - порядок графем соответствует фонемному порядку алфавита русского языка.
Данный вариант предложен в целях соотнесения татарского и русского алфавитов для
удобства составления параллельных словарей, что особенно актуально в условиях
функционирования двух государственных языков (то есть татарский алфавит на осное
латиницы упорядочен на основе ЛГУ русского алфавита по фонемному принципу).
Вариант 4 – порядок графем определен на основе статистических данных частотности
фонем (На статистическом материале, приведенном Бухараевым Р.Г., Ибрагимовым Т.И.,
Еникеевым А.И. в сборнике трудов [4]).
Вариант 5 – тот же алфавит (вариант 4) упорядочен по принципу фонемной близости
графем.
Кроме того, для каждого варианта 1-5 разработаны по 3 уточненные таблицы (A, B, C),
отображающие те же алфавиты для случаев, когда буква C используется для отображения
фонем ‘Ц’,‘Җ’ или ’Ч’, соответственно.
На первый взгляд, букву ‘Ч’ целесообразно отображать привычной комбинацией ‘Ch’,
что, как правило, и предлагается сторонниками передачи фонем в виде комбинации букв.
Однако как показывает изучение частотности этих трех фонем и букв, фонема ‘Ч’
(коэффициент частотности: 0,015) в три раза чаще встречается в татарских текстах, нежели
фонема ‘Җ’ (коэффициент частотности: 0,005) (фонема ‘Ц’, как считается, не присуща для
литературного татарского языка), а буква ‘Ч’ даже еще более частотна, чем буквы ‘Җ’ и ‘Ц’.
Коэффициент частотности буквы ‘Ч’ – 0,017, буквы ‘Җ’– 0,004, буквы ‘Ц’ – 0,0004. То есть
буква ‘Ч’ встречается более чем в 4 раза чаще буквы ‘Җ’ и более чем в 40 раз чаще чем
буква ‘Ц’. Этот показатель для буквы ‘Ц’ относительно ‘Ч’ может варьировать от 10-12 раз в
технических текстах до более чем 400 раз в татарской прозе. Например, в произведении
Н.Гиматдиновой «Пәри утарында» [5] буква ‘Ч’ встречается более 1200 раз, тогда как буква
‘Ц’ - всего в трех случаях.
Приведенные частотные показатели достаточно убедительно демонстрируют, что
татарские тексты будут существенно короче, и также потребуется меньше нажатий на
клавишу, когда именно фонема ‘Ч’, а не фонемы ‘Җ’ и ‘Ц’, будет отображаться одной
буквой. В нашем случае – латинской буквой ‘C’ (как это было в Yanalif 1). Исходя из этого,
наиболее предпочтительными во всех пяти вариантах нам представляются алфавиты,
приведенные в таблицах С).
Вариант 1 (на основе английского алфавита)
А) Ц - C, Җ – Jh, Ч - Ch
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
А
Ä
B
C
D
E
F
G
H
I
J
K
L
M
N
O
Ö
P
R
S
T
U
Ü
W
Y
Z
а
ә
б ц д э ф г
һ И
й
к
л
м
н
о
ө
п
р
с
т
у
ү
в
ы
з
87
B) Җ - C, Ч - Ch, Ц – Ts
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
А
Ä
B
C
D
E
F
G
H
I
J
K
L
M
N
O
Ö
P
R
S
T
U
Ü
W
Y
Z
а
ә
б җ д э ф г
һ и
й
к
л
м
н
о
ө
п
р
с
т
у
ү
в
ы
з
C) Ч - C, Ц – Ts, Җ – Jh
Достарыңызбен бөлісу: |