Атты І халықаралық конференция ЕҢбектері


The problems of computer processing of the Kazakh language



Pdf көрінісі
бет19/326
Дата07.01.2022
өлшемі8,57 Mb.
#19269
1   ...   15   16   17   18   19   20   21   22   ...   326
Байланысты:
Болатбек М. (1)

3. The problems of computer processing of the Kazakh language 
At  present  the  development  of  any  natural  language  is  unthinkable  without  information 
technologies.  There  are  already  developed  multimedia  dictionaries,  automation  programs  for 
teaching,  machine  translation,  speech  recognition  and  synthesis,  text  generation,  text  content 


20 
 
interpretation, etc. for English, French, Russian, Japanese, Chinese and other languages. This level 
of development is possible for the Kazakh language too. 
Computer  processing  of  the  Kazakh  language  involves  the  creation  and  use  of  the  appropriate 
information  resources  in  the  Kazakh  language.  The  databases  of  spelling  and  terminological 
dictionaries, the Kazakh language training systems, programs translators from the Kazakh language 
to  another  and  vice  versa,  code  conversion  systems  of  the  text  in  the  Kazakh  language  from  one 
graphics  to  another,  speech  recognition  and  synthesis  system,  etc.  In  this  regard  we  carry  out  the 
project  “Automation  of  recognition  and  generation  of  the  Kazakh  written  and  spoken  languages” 
which  is  also  financed  by  MES  since  2011  on  a  priority  “Information  and  telecommunication 
technologies”. 
It  is  known  that  all  computers  and  telecommunications  equipment  manufactured  in  the  world 
support  and  will  support  the  English  alphabet.  To  input  and  process  characters  of  other  alphabets 
one needs special code tables and drivers, their development and installation requires a considerable 
amount of money and intellectual efforts. 
It is known that development of information resources is a science intensive and costly process. 
It is carried out by the use of modern information technologies that support the English alphabet by 
default. Today in many countries, Germany and Russia, are being discussed issues of development 
of  information  resources  in  the  English-based  alphabets,  which  not  requires  the  development  of 
fonts and program drivers, various sorting, search and recognition programs (e.g. for scanners). And 
all that requires large extra costs and highly qualified human resources. By this reason, in order to 
considerably facilitate development of information resources in Kazakh and reduce their costs it is 
necessary  to  convert  the  Kazakh  writing  system  to  the  Latin  graphics.  We  must  also  retain  the 
same  sequence  of  letters,  this  will  enable  us  to  use  built-in  sorting,  search  and  recognition 
programs  included  in  any  system  packages  that  rapidly  change  depending  on  the  computer 
hardware  specifications.  Otherwise  operating  on  the  basis  of  Cyrillics  alphabet  of  the  Kazakh 
language generates a collateral and unjustified problem of support of the Kazakh alphabet without 
which decision possibility of use of modern information technologies is absolutely excluded. Some 
drivers  are incompatible with  each other that leads to  a redoing of  previously created information 
resources and require an additional labor and material costs. 
Now because of the lack or inconsistency of such drivers, even in attempt of transfer of the text 
in the Kazakh language from one computer to another it is necessary to perform anew work on its 
set  and  formatting.  At  mass  penetration  into  an  everyday  life  of  computers  with  various 
configurations  and  program  systems  the  volume  of  such  unnecessary  works  will  increase.  And  if 
now  not  to  take  drastic  and  reasonable  measures,  the  problem  will  pass  from  category  difficult 
solvable in unsoluble, and we should in empty be spent as, first, quite often there will be vain works 
on  creation  of  earlier  created  information  resources,  secondly,  development  and  adjustment  of 
necessary drivers demand considerable financial means and intellectual efforts. 
For those who worries that because of alphabet change we will lose and we won't be able to read 
earlier published literary, cultural, scientific, it is possible to tell that there are no serious problems. 
For this purpose it is necessary to enter only once into memory of the computer the necessary text 
presented on the basis of any graphics. Translation of the Kazakh text from one graphics on other 


Достарыңызбен бөлісу:
1   ...   15   16   17   18   19   20   21   22   ...   326




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет