● Қоғамдық ғылымдар ҚазҰту хабаршысы №4 2015 625жүктеу 354.31 Kb.
Pdf просмотр
Дата12.03.2017
өлшемі354.31 Kb. 

Қоғамдық ғылымдар 

 

ҚазҰТУ хабаршысы №4 2015  

 

625 Шаяхметова К. Б.  

Распознавание и обработка текста для перевода на иностранный язык 

Резюме.  В  данной  статье  рассмотрены  некоторые  принципы  работы  системы  распознавания  изображе-

ния Tesseract OCR, который является основным инструментом при разработке приложения для обработки изоб-

ражения и дальнейшего перевода. В частности всю работу можно разделить на следующие части: определение 

с фиксированным шагом, распознавание слов, лингвистический анализ. В дополнение приведен алгоритм рабо-

ты самого приложения. 

Ключевые  слова:  распознавание  изображений,  обработка  текста,  мобильное  приложение,  компьютер-

ное зрение. 

 

К. Shayakhmetova 

determination and processing of a text for the interpretation on foreign language  

Resume. This article describes some of the principles of the image recognition system Tesseract OCR, which is 

the main tool for the development of image processing applications, and further translation. In particular, the work can 

be divided into the following parts: the definition with a fixed pitch, word recognition, linguistic analysis. In addition, 

the algorithm of how  the application works is given. Key words: image recognition, text processing, mobile application, computer vision. 

 

 УДК 004 

 

А.Н. Абеустанова 

(Әль-Фараби атындағы Қазақ ұлттық университеті, 

Алматы, Қазақстан Республикасы, happiness_love_01@mail.ru) 

 

ҚАЗАҚ ТІЛІНДЕГІ КӨПМАҒЫНАЛЫ СӨЗДЕРДІҢ БІРІН АНЫҚТАУДЫҢ БІР БОЛЖАМЫ 

 

Аннотация. Қазіргі таңда сөзді бір тілден екінші тілге аударған кезде бірнеше проблемалар туындайды, 

сондықтан  да  бұл  проблеманы  шешу  үшін  мысал  ретінде  көпмағыналы  сөздер  қарастырылған.  Машиналық 

аудару кезінде сөйлем аудару оңайға соқпайды, бірнеше, атап айтқанда құрылымдық, лексикалық тараптар жа-

ғынан  сұрақтар  туындайды.  Сол  сұрақтарға  жауап  беру  үшін  сөйлем  мен  сөз  таптары  арасындағы  байланыс 

көрсетіліп,нақты есептеулер жүргізілген. 

Кілттік сөздер: көпмағыналы сөздер, ықтималдық, қазақ тілі  

 

Тіліміздегі ұзақ уақыт бойы қолданылып келе жатқан байырғы сөздер жаңа сөз, жаңа мағына-лар  жасауға  ұйытқы  болады.  Олар  бұрынғы  тура  мағынасының  үстіне  жаңадан  бір  не  бірнеше  қо-

сымша,  яғни  туынды  мағыналарға  ие  болып  жатады.  Соның  нәтжесінде  сөздік  қордағы  сөздер  сан 

жағынан да, сапа жағынан да дамып, жетіліп, тілдің байлығы артады. Сөздің екі я одан да көп мағы-

наға ие болуын сөздің көп мағыналылығы дейміз. Көп мағыналы сөздер бір негізден таралады да, бір 

сөз табына қатысты болады. Мысалы: Бас (зат есім) - 1) адамның, айуанның, жәндіктің дене мүшесі; 

2) шөптің, ағаштың ең жоғарғы жағы; 3) таудың ең үсті, төбесі; 4) өзеннің, бұлақтың басталған жері; 

5) таяқтың ұшы; 6) балтаның, шоттың жүзі бар жағы; 7) бір нәрсенің айналасы. Ата (зат есім) - 1) үл-

кен әке, әкенің әкесі; 2) ата жолы - ескіден қалған женө-жоба, әдет-ғұрып; 3) ата жұрт - ежелгі мекен; 

4) ата кәсіп - атадан келе жатқан шаруашылық. Сонымен, сөздің қолданылу аясының өзгеруі, яғни бір 

саладан басқа бір салаға ауысуы оның мағынасының өзгеруіне әсер етеді. [7] 

Тілдегі кейбір сөздер бірнеше мағынада қолданылады. Екі не одан да көп мағынада қолданыла-

тын сөздер көп мағыналы сөздер деп аталады. Көп мағыналы сөздер бір сөз табынан болады және бір 

негізден таралады. Мысалы, адамның немесе жан-жануардың көзі, иненің көзі, терезенің көзі, бұлақ-

тың көзі, білімнің көзі, істің көзі. Осы тіркестердегі «көз» сөзі – бір негізден таралған зат есім.  

Бұл жұмыстың идеясы негізінде  машиналық аудармашының көмегімен ағылшын тілінен қазақ 

тіліне аударылған мәтінді түзету болып саналады. Дәлірек айтсақ, аударылған сөйлем ішінен көп ма-

ғыналы сөзді таңдап және түзету болып келеді. 

 

 

 Общественные науки 

 

                               №4 2015 Вестник КазНТУ  

 

626 Мысалы: 

Кесте1. Кез-келген бір сөйлем 

 

... 


w

… … 

w… 

… 

      Жоғарыда  көрсетілген  кестедегідей  кез-келген  бір  сөйлем  берілсе,  сол  сөйлемнің  ішінен  тек 

көп  мағыналы  сөздер  ғана  таңдалынып  алынады.  Машиналық  аударманың  көпмағыналы  сөздерді 

таңдау  үшін  максимум  энтропия  тәсілі  қолданылады.  Бұл  әдістің  жалпы  түрдегі  сипаттамасы  мына 

түрде келеді: 

 

f1 үшін


 c,w

i

 =1 if wordi=

"word"


 & c=TAG

 

                   0 otherwise  

Сөйлемдегі көпмағыналы сөздерді түзету үшін түсіндірмелі  сөздік пен қазақ тіліндегі  сөйлем-

дер жиыны қажет. Мәтін әр саладағы кез-келген сөйлемдерден тұратын корпустардан жиналған. Мы-

сал ретінде келесі кестені көрсетуге болады.  

 

Кесте 2. Көпмағыналы сөздер мен баламалары  

Сөздер 


Сөз тіркестері 

Сөз табы 

ана 

ана кітапты ал, ана мекеме 

PRN 


ана 

ана келді,анама ұнайды,ана жақсы көреді 

NN 

 

 Нақты есептеулер жүргізілу үшін 1235 сөйлемнен  тұратын кішігірім  корпус алынды. Бастама-

сында талдау жасау үшін көпмағыналы сөздердің бірі «ана» сөзіне талдама жасалынды. Аталған кор-

пуста «ана» сөзі 7 рет кездесті: 

1 Анасы оны өте жақсы көреді екен. 

2 Бір күні анасы бәліш пісіріп,қызына кешікпеуін айтады. 

3 Оған анамның пісірген бәлішінен және бір құты май алып бара жатырмын. 

4 Сен мына жолмен бар,мен ана жолмен жүрейін. 

5 Мен сізге анам бәліш пен бір құты маймен жіберді. 

6 Ұлы әкесінің мақтанышына, анасының қуанышына айналады. 

7 Сен ана қызықты кітапты ал. 

Аталған сөйлемдерде  «ана» сөзі зат есім мен үстеу ретінде кездесетінін байқауға болады. Тал-

дама жасау үшін нақты екі түрлі сөз табынан сөйлем алынып талданылды: 

1 Анасы оны өте жақсы көреді екен. 

2 Сен ана қызықты кітапты ал. 

 

Сөйлемдердегі әр сөздің сөз табы көрсетілген:    NN   PRP   PR     ADV    VB   RP 

1 Ана   ол     өте    жақсы   көр екен. 

   PRP   PRN    ADJ        NN       VB 

7 Сен    ана      қызық    кітап     ал. 

 

Сөз таптарының орналасуына қарай максимум энтропия үлгісін қолдандым:  f1 үшін

 c,x =1 if word

i=

"ана"


 & c=NN

 

                     0 otherwise f2 үшін

 c,x =1 if t

i+1=

PRN


 & c=NN

 
 

Қоғамдық ғылымдар 

 

ҚазҰТУ хабаршысы №4 2015  

 

627                      0 otherwise 

f3 үшін


 c,x =1 if t

i+2=


NN

 & c=PRN


 

                     0 otherwise 

f4

 

үшін c,x =1 if word

i=

"ана" & c=PRN

 

                     0 otherwise f5

 

үшін c,x =1 if it is uppercase(wordi)

 & c=NN


 

                     0 otherwise 

f6

 

үшін c,x =1 if ti+1

=

ADJ & c=PRN 

 

                     0 otherwise Осы ережелерге сәйкес кесте толтырылды: 

 

Кесте 3. Зат есім мен үстеудің әр жағдайдағы ықтималдығы  

 

 f1 

f2 


f3 

f4 


f5 

f6 


PRN 

PRN 

1/7=0.142 

2/7=0.285 

1/7=0.142 NN 

NN 5/7=0.714 

1/7=0.142 1/7=0.142 

 Есептеулер нәтижесінде көпмағыналы сөздің екі сөз табы болғандағы салыстырмалы ықтимал-

дықтар есептелінді: P(NN/x)=0.6393  және  P(PRN/x)= 0.3942 

Есептелінген  нәтижелер  бойынша  қорытатын  болсақ,  кез-келген  сөз  таптары  арасындағы  ық-

тималдықтарды  ескере  отырып,  қолдану  қажеттігіне  тиімді  пайдалансақ  болады.  Яғни,  кез-келген 

қазақ мәтініндегі кездескен көпмағыналы сөздің бірнеше баламаларын салыстырып дұрыс нұсқасын 

таңдауға болады. 

 

ӘДЕБИЕТТЕР 1.  Митчелл Шниер. Толковый словарь компьютерных технологий. Пер. с англ. -Киев: Диа Софт, 2007. -720 с. 

2.  Қазақ тiлi терминдерiнiң салалық ғылыми түсiндiр ме сөздiгi: Информатика және компьютерлiк техни-

ка /Редакциясын басқарған А.Құсайынов. -Алматы: ”Мектеп” баспасы ЖАҚ, 2002. -456 б. 

3.  Бидайбеков  Е.Ы.,  Біләлов  Ш.,  Григорьев  С.Г.  Ақпараттану  атаулары:  Ағылшынша-орысша-қазақша 

атаулар. -Алматы: Білім. 1998. -224 б. 

4.  Бөрібаев  Б.,  Балапанов  Е., Есжанов  А.  Информатика  терминдерінің  түсіндірме  сөздігі:  Оқу  құралы.  -

Алматы: Жаңа технологиялар институты, 2009. -140 б. 

5.  Мирончиков И.К., Павловцев В.А. Англо-русский толковый словарь по Интернет: Изд. 4-е, исп. И доп. 

-Мн.: Хервест, -М.: АСТ, 2008. -288 с. 

6.  Григорьев В.Л. Англо-русский толковый словарь РС. -М: Компьютер, ЮНИТИ, 1997. -471 с. 

7.  http://szh.kz/ 

  

Абеустанова А. Одно предположения выбора одного варианта многозначного слово на казахском языке 

Резюме.  На  сегодняшний  день  при  переводе  одного  слово  от  одного  языка  на  второй  язык  возникают 

несколько  проблем,  поэтому  для  того  чтобы  решить  был  взят  в  виде  примера  многозначного  слово.  При  ма-

шинном переводе  перевести предложение  нелегко, возникают несколько проблем, таки как  структурные, лек-

сические проблемы. Для того чтобы ответить на эти вопросы были показаны связи между предложением и час-

тями речи и были высчитаны точные расчеты.  

Ключевые слова многозначные слова, вероятность, казахский язык  

 
 Общественные науки 

 

                               №4 2015 Вестник КазНТУ  

 

628 Abeustanova A. 

One assumptions of a choice of one option multiple-valued the word in the Kazakh language 

Summary. Today when transfer one word from one language on the second language there are some problems 

therefore was taken to solve in the form of an example multiple-valued the word. At machine translation it is hard to 

translate the sentence, there are some problems, as structural, lexical problems. To answer these questions communica-

tions between the offer and parts of speech were shown and exact calculations were calculated. 

 Key words multiple-valued words, probability, kazakh language  

  

  Арыстанбаева З.К. 

(КазНТУ им. К.И. Сатпаева, г. Алматы, Республика Казахстан)  

СОВРЕМЕННАЯ АРХИТЕКТУРА И ОСВОЕНИЕ  

ПОДЗЕМНЫХ ПРОСТРАНСТВ 

             

Аннотация. Современный этап развития архитектуры «Подземные сооружения», даны примеры взаимо-

связи архитектурной концепции подземной урбанистики, как вариант общественного интерьера в развитии идеи 

подземного пространства (автотранспортные и железнодорожные тоннели, метрополитены, автостоянки и.т.д.) 

Ключевые слова:  Проектирование, город, пространство, архитектура, подземные комплексы, метро. 

 

 

Современную городскую среду невозможно представить без  объектов, использующих подзем-

ные пространства, так как его освоение крайне актуально, особенно  в центральных городских райо-

нах, характеризующихся высокой плотностью застройки.  

Районы, где зачастую планируется размещение подземных пространств  наиболее ценные, и по-

сещаемые  (центральная  общественная  зона  города)  .  Примерами  таких  подземных  сооружений  обще-

ственного назначения являются: Kомплекс подземных сооружений на Kарлсплац, Mюнхен (Германия), 

Kомплекс подземных сооружений на пл. Xауптвахе, г.Франкфурт-на-Mайне, (Германия); театральные, 

концертные и выставочные залы (театр "Латерна магика" и зал "Aльгамбра" в Праге, консерватория и 

Центр искусств и ремёсел в Париже, Mузей современного искусства в Hью-Йорке), торговые залы уни-

версальных  магазинов  и  рынков  (Галери-Лафайет  в  Париже,  Булл-Pинг  в  Бирмингеме),  торгово-

пешеходные  комплексы  и  улицы-пассажи  (г.Xельсинки,  г.Bена,  г.Oсака),  ж.-д.  вокзалы  (г.Bаршава, 

г.Брюссель;  г.Kопенгаген,  г.Hеаполь,  г.Cидней,  г.Mонреаль),  автобусные  вокзалы  (г.Чикаго,  г.Лoc-

Aнджелес) и аэровокзалы (Oрли в Париже, Фьюмичино в Pиме, Hациональ в Брюсселе, им. Даллеса в 

Bашингтоне), метрополитены, действующие в более чем 70 городах мира (1985), и др. [1].   

Но не многим известно, что освоение подземных пространств велось уже в древнем Египте, где 

подземные пространства использовали в храмовом строительстве.  Считается, что подземные соору-

жения городов с древней историей (например г.Москва) зачастую можно классифицировать следую-

щим образом: оборонные, торгово-складские, тайных дел, каменоломни и.т.д.) [2 с.49].   

Современный  город  не  в  состоянии  существовать  и  развиваться  без  освоения  подземны  про-

странства.  Именно  поэтому  необходимо  четко  определять  и  классифицировать  подземные  сооруже-

ния  на  территории  города.  Подземными,  принято  называть  такие  сооружения,  главные  части  кото-

рых, по эксплуатационным соображениям располагаются ниже уровня земли. 

 По своему назначению данный тип сооружений в современном городе подразделяют на:  

1)  транспортные  (пешеходные,  автотранспортные  и  железнодорожные  тоннели,  метрополите-

ны, автостоянки и.т.д.); 

2)промышленные (корпуса первичного дробления руды, подземные части бункерных эстакад и.т.д.); 

3)энергетические (подземные комплексы ГЭС, ГАЭС и АЭС и.т.д.); 

4)хранилища (нефти, газа и.т.д.); 

5) общественные (предприятия коммунально-бытового  обслуживания, торговли, общественно-

го питания, складские, спортивные и зрелищные сооружения); 

6)инженерные (тоннели и коллекторы тепло-, газо- электросетей и водопровода и.т.д.);  

7) специального научного назначения (ускорители заряженных частиц, тоннели для испытаний, оборонные объекты и.т.д.) [2 с.74].   

Каталог: files -> newspapers -> 101
newspapers -> Алматы қаласындағы ауаның экологиялық жағдайы
newspapers -> Литература [1] Орир Дж. Физика / Пер с англ. М: Мир, 1981. С288. [2]
101 -> Физико-математические науки №4 2015 Вестник Казнту
newspapers -> Практикум по статистике: Учеб пособие для вузов/ Под ред. В. М. Симчеры. М.: Финстатинформ, 1999
101 -> Распознавание и обработка текста для перевода на иностранный язык
newspapers -> Коррекция состава верблюжьего молока для производства сыров
101 -> ● Науки о Земле
101 -> ● Общественные науки


Поделитесь с Вашими друзьями:


©emirsaba.org 2019
әкімшілігінің қараңыз

    Басты бет