Применение энтропии в лингвосинергетике



Pdf көрінісі
Дата30.01.2017
өлшемі185,12 Kb.
#3004
түріАнализ

Б.Р. ОСПАНОВА, С.Ш. КАЖИКЕНОВА, Н.А. КАСЕНОВА

(Карагандинский государственный технический университет,

Карагандинский государственный университет им. Е.А.Букетова, г. Караганда, Казахстан)

ПРИМЕНЕНИЕ ЭНТРОПИИ В ЛИНГВОСИНЕРГЕТИКЕ

Аннотация

Рассмотрены   вопросы   применения   энтропийных   критериев   в   лингвосинергетике.

Анализируются   ключевые   проблемы   синергетики   как   междисциплинарного   научного

направления. 

Рассматривается   текст   как   комплексный   природный   объект,   как   сложная

многоуровневая   синергетическая   система.   Анализируется   его   структура   в   рамках

многоаспектности.   Изложены   некоторые   аспекты   экспериментального   подхода

вычисления энтропии текстов, приводятся экспериментальные данные, демонстрирующие

результаты. Предлагается лингво-математическая модель для анализа структуры текста,

построенная   на   основе   фундаментального   закона   сохранения   суммы   информации   и

энтропии   с   применением   формулы   Шеннона,   а   также   дается   сравнительно-

сопоставительный   анализ   энтропийных   характеристик   текстов   в   казахском   и   русском

языках.

Предлагаемая   методология   основана   на   системном,   многоуровневом   подходе   к



построению сложной иерархической системы языка.

Ключевые слова: энтропия, лингвосинергетика, текст, самоорганизующаяся система,

относительная частота, вычисление, информация, бит, объект, многоуровневый.



Кілт   сөздер:  энтропия,   лингвосинергетика,   мәтін,   өзін-өзі   ұйымдастыру   жүйесі,

қатыстық жиілік, есептеу, ақпарат, бит, нысан, көп дәрежелі.



Key words: entropy, lingua-synergetic, text, self-organizing system, the relative frequency,

evaluation, information, bit, object, multi-level.

 

«Среди   фундаментальных   законов   природы   особенно   велико   значение   законов



сохранения количества движения, энергии и т.д. А также роста энтропии, суть которого

заключается в том, что любая система, предоставленная самой себе, дезорганизуется, в

ней возрастает беспорядок, хаос, происходят потери энергии, и, в конце концов, наступает

распад.  Но   в  природе   и   обществе,   однако,   существуют   и   обратные   процессы   —

упорядочения, становления, системообразования, накопления, повышения иерархических


уровней   энергии   в   результате   разумной   деятельности   человечества,   стремящегося   к

одухотворению и преображению мира».[1]

Как   известно,   основополагающим   в   теории   самоорганизации   является

противопоставление «порядок – хаос». Информация и энтропия характеризуют сложную

систему   с   точки   зрения   упорядоченности   и   хаоса,   причем   если   информация   —   мера

упорядоченности,   то   энтропия   —   мера   беспорядка.   Эта   мера   простирается   от

максимальной энтропии, т.е. хаоса, полной неопределенности до высшего уровня порядка.

В современных условиях появление нового познания выглядит вполне закономерно и

наиболее   актуальным   в   них   становится   синергетика.   Она   является   важнейшим

направлением научных исследований, в рамках которого изучаются процессы перехода от

хаоса к порядку и обратно в открытых нелинейных средах различной природы. Это новое

мировидение, новый взгляд человека на действительность, новая философия. Предметом

синергетики является изучение процесса самоорганизации систем. 

Синергетика,   стремительно   развиваясь,   находит   применение   в   различных   областях

науки   и   техники.   Основные   ее   положения,   имеющие   непосредственные   отношения   к

лингвистическим  приложениям,  в настоящее  время активно  исследуются  языковедами.

Ими   разрабатываются   такие   идеи,   которые  связаны   с   исследованием   принципов

самоорганизации,   нелинейности,   неравновесности,   бифуркационных   изменений,

необратимости   времени,   неустойчивости   как   основополагающей   характеристики

процессов эволюции.

Синергетика в лингвистике сегодня представляет объединяющее  направление,  цель

которой состоит в выявлении общих идей, методов, закономерностей перехода языка от

одного уровня организации к другому. Язык, постоянно находясь в развитии и движении,

является сложной, динамичной, самоорганизующейся системой. 

Лингвосинергетические идеи, нашедшие отражение в работах В. А. Пищальниковой,

В.Н.   Базылева,   Н.Л.   Мышкиной,   Э.В.   Губернаторовой,   М.М.   Черновой,   Е.В.   Рыловой,

Н.В. Дрожащих, М.М. Тонковой, Г.Г. Москальчук, А.Ю. Корбут, К.И. Белоусова, И.А.

Герман и других ученых, оказали исключительно важное влияние на изучение процессов

порождения   и   восприятия   текста.   Текст   рассматривается   как   один   из   сложнейших

объектов лингвистического исследования. В настоящее время предприняты попытки по-

новому взглянуть на текст и его структуру с позиции лингвосинергетики. Разнообразие

подходов к тексту порождает многочисленные варианты его понимания.

Одной   из   наиболее   интересных   работ   в   области   лингвистической   синергетики

являются   исследования   З.Жанабаева,   который   рассматривает   перспективы   взаимосвязи

лингвистики   с   синергетикой   -   новой   методологией   физико-математических   и

естественных наук, бурно развивающейся в последние десятилетия. Автор ряда статей о

синергетике детально рассматривает пути синергетического подхода к лингвистике. По

мнению   З.   Жанабаева,   язык   как   средство   общения   людей,   передачи   мысли   следует

рассматривать как самоорганизующую систему, так как эта «стохастическая, случайным

образом   сформированная   макроскопическая   система   знаков   состоит   из   многих

структурных   элементов:   фонем,   слов,   предложений.   Фонетические,   грамматические,

синтаксические правила отражают появление порядка из хаоса – самоорганизацию». В

своей   работе   «Синергетическое   будущее   лингвистики»   автор   подчеркивает,   что

«семантика языка выступает как более сложный иерархический уровень самоорганизации,

являющийся   продуктом   совместного   функционирования   этих   правил…   Решающие


условия   самоорганизации   –   незамкнутость,   нелинейность,   неравновесность   всегда

сопровождают формирование и эволюцию языка».[2] 

Известный   лингвист  В.А.   Пищальникова,   исследуя   текст   как   результат   процесса

самоорганизации,   рассматривает   язык   как   неотъемлемое   свойство   организации   живой

системы – человека. Этот интегративный принцип должен обуславливать все существенно

важные типы функционирования человека в среде, в том числе и его языковое бытие,

поэтому параметры  лингвистического  объекта,  по словам исследователя,  должны  быть

существенно изменены. Это, во-первых, требует детальной проработки различий между

организацией   и   структурой   языка   как   лингвистических   понятий,   во-вторых,   изучение

структуры языка может осуществляться только в коммуникативном процессе, в-третьих,

четкое разграничение характеристик изучаемого феномена и характеристик концептов, с

помощью которых осуществляется его описание.[3]

Итак,   видение   языка   как   самоорганизующегося   процесса,   как   неравновесную,

неустойчивую   систему,   изменяющуюся   под   воздействием   флуктуаций,   позволяет

рассматривать   текст   как   объект   синергетики,   как   комплексный   многоуровневый

природный объект. Так, по словам Белоусова К.И. и Москальчук Г.Г., текст представляет

собой сложную многоуровневую синергетическую систему, направленную во времени и

распределенную в некотором пространстве, систему, устанавливающую в процессе своей

эволюции многообразные формы взаимодействия между отдельными ее подсистемами.

[4]


К тому же текст как синергетическое явление представляет собой живой организм,

подобно другим биологическим объектам строящийся по закономерностям, заложенным в

природе.  Подобное видение текста позволяет предположить  наличие внутренней жизни

текста   как   текстового   пространства,  пространственно-временной   организации   текста,

становление которого описывается как движение, как изменение материи во времени. По

мнению   Мышкиной   Н.Л.,   необходим   специфический   подход   к   анализу   текста,

вскрывающий внутренний механизм движения текстового пространства, раскрывающий

формы, механизмы и характеристики в их системных и асистемных воплощениях не в

противопоставлении внутренней формы текста внешней, а в их синергии. [5]

Конечно, говоря о тексте как  результате речетворческого процесса, нельзя не учесть

того,   что   имеется   целая   система   текстов,   различных   по   стилям   и   функциональной

предназначенности:

общенаучные,   теоретического   плана   тексты,   основанные   на   логико-понятийном



воспроизведении результатов познания;

технические   тексты   прикладного   характера,   основанные   на   изложении   готового



знания и рассчитанные на прямое исполнение предписанного;

информативные   тексты,   представляющие   собой   перечень   фактов   (словари,



справочники и т.д.);

агитационно-пропагандирующие тексты, воздействующие на сознание адресатов;



тексты средств массовой информации, сочетающие особенности информативных и

агитационных текстов;

художественные   тексты,   использующие   особенности   образного   отражения



действительности;

разговорные тексты, основанные на ассоциативном мышлении и т.д.



Несомненно, каждый вид текста имеет свои специфические, свойственные именно ему

черты. Однако можно выделить наиболее общие признаки, правила построения текста в

целом. Этими основными признаками текста в самом общем виде являются целостность и

связность.   Объясняется   это   тем,   что   текст   как   объект   лингвистического   исследования

представляется,   прежде   всего,   как   информационное   и   структурное   единство,   как

функционально   завершенное   речевое   целое.   Именно   это   качество   текста   в   настоящее

время   дает   возможность   определить   достаточно   четкие   закономерности

текстообразования.

Таким   образом,   текст,   как   самоорганизующаяся   система,   сложная,   открытая,

устойчивая, подвижная, стабильная и изменчивая, представляет собой целостный объект,

характеризующийся   внешними   формами   и   внутренней   жизнью.   «Внутренняя   жизнь

текста имеет динамическую, энергетическую природу, обнаруживающуюся в движении

текстового пространства взаимодействием внутренней и внешней форм».[5]

В   основу   информационно-энтропийного   анализа   положено   сопоставление   текстов

различных жанров и стилей на русском и казахском языках. С помощью синергетической

теории информации проведен структурный анализ произвольных текстов со стороны их

хаотичности и упорядоченности по количеству и числу встречаемости отдельных букв.

Разработана   лингво-математическая   модель   для   анализа   структуры   текста,

построенная   на   основе   фундаментального   закона   сохранения   суммы   информации   и

энтропии   с   применением   формулы   Шеннона.   При   общей   характеристике   энтропийно-

информационного (энтропия – мера беспорядка, а информация – мера снятия беспорядка)

анализа   текстов   мы   использовали   статистическую   формулу   Шеннона   для   определения

совершенства, гармонии текста:

                                                                                                                 







N

i

i

i

p

p

H

1

2



log

,

(6)



где  р

i

  –   вероятность   обнаружения   какой-либо   единицы   системы   в   их   множестве  



N

;





N



i

i

p

1

1



,

0





i

p

 

N



i

,...,


2

,

1



.

В процессе нашего исследования был проведен информационно-энтропийный анализ



отрывка   из   монографии   А.Х.   Маргулана,   Т.К.   Баскенова,   М.М.   Мендикулова

«Архитектура   Казахстана»   на   русском   и   казахском   языках.   Отметим,   что   расчеты

проводились   только   для   нахождения   относительных   частот   однобуквенных   сочетаний.

Данный   отрывок   представляет   собой   текст   общенаучного   плана   (научно-популярного

стиля),   в   котором   собраны   исторические   факты,   касающиеся   наследия   зодчества   и

градостроительства Казахстана. Достаточно большого объема текст, состоящий из 30 000

букв. 

Так как русский алфавит содержит 32 буквы (31 буква, 1 пробел), то согласно этому



результату

5

32

log



0



H

 бит.


где 

0

H

- максимальное значение энтропии текста, заключающегося в приеме одной буквы

русского текста (информация, содержащаяся в одной букве), при условии, что все буквы

считаются одинаково вероятными; 

бит – единица измерения информации.

Для вычисления информации текста нами были подсчитаны вероятности появления

каждой буквы в данном отрывке. При подсчете учитывались 31 буква русского алфавита

(буквы е и еъ и ь принимаются как одна буква) и пробел, все остальные знаки (скобки,

кавычки, запятые и пр.) не рассматривались. Цифровые данные, содержащиеся в тексте,

расписаны   прописью.   Подсчет   вероятности   (р)   появления   различных   букв   в   тексте

достигается   расчетом   относительной   частоты   отдельных   букв.   Для   определения

вероятности   появления   одной   буквы   в   тексте   воспользуемся   классической   формулой

определения вероятности: 

)



.

(

буквы



одн

P

n

m

,

Р - относительная частота; m- число появления одной буквы в тексте; п - число появления

всех букв в тексте.

Например, число появления буквы «а» в тексте 2153, а 30 000 –это число появления

всех букв в данном тексте.

Отсюда Р(а)b                                     

 

0717



,

0

30000



2153 

Итак, чтобы рассчитать относительную частоту буквы, необходимо число появления



каждой буквы разделить на количество всех букв в тексте.

В   таблице   1   буквы   расположены   в   алфавитном   порядке,   в   таблице   2  –  по   мере

убывания относительных частот.

Таблица 1. Вычисление относительной частоты в алфавитном порядке



Буква

Число

появления

буквы:

количество

всех букв

Р

(частота)



Буква

Число

появления

буквы:

количество

всех букв

Р

(частота)

1.

пробел

4018:30000

0,1339


17

п

594:30000

0,0198

2.

а



2153:30000

0,0717


18

р

1409:30000

0,0469


3.

б

399:30000

0,0133

19

с

1500:30000

0,050

4.

в



1166:30000

0,0388


20

т

1487:30000

0,0495

5.

г



489:30000

0,0163


21

у

560:30000

0,0186

6.

д



814:30000

0,0271


22

ф

42:30000


0,0014

7.

е

2224:30000

0,0741


23

х

401:30000

0,0133

8.

ж



204:30000

0,0068


24

ц

176:30000

0,0058

9.

з



461:30000

0,0153


25

ч

273:30000

0,0091

10

и



2041:30000

0,0680


26

ш

186:30000

0,0062

11

й



308:30000

0,0102


27

щ

92:30000


0,0030

12

к

949:30000

0,0316


28

ы

655:30000

0,0218

13

л



1111:30000

0,0370


29

ь,ъ

381:30000

0,0127

14

м



762:30000

0,0254


30

э

54:30000


0,0018

15

н

1711:30000

0,0570


31

ю

113:30000

0,0037

16

о



2789:30000

0,0929


32

я1

492:30000

0,0164

Если   расположить   знаки   последовательно   (в   порядке   убывания),   то   получится



следующая таблица:

Таблица 2. Расположение относительной частоты одной буквы в порядке убывания

Буква

Относит. частота



-

0,1339


о

0,0929


е

0,0741


а

0,0717


и

0,0680


н

0,0570


с

0,050


т

0,0495


Буква

Относит. частота

р

0,0469


в

0,0388


л

0,0370


к

0,0316


д

0,0271


м

0,0254


ы

0,0218


п

0,0198


Буква

Относит. частота

у

0,0186


я

0,0164


г

0,0163


з

0,0153


х

0,0133


б

0,0133


ь, ъ

0,0127


й

0,0102


Буква

Относит. частота

ч

0,0091


ж

0,0068


ш

0,0062


ц

0,0058


ю

0,0037


щ

0,0030


э

0,0018


ф

0,0014


Приравняв   частоты   вероятностям   появления   соответствующих   букв,   получим   для

энтропии языка с учетом одной буквы русского текста приближенное значение:

4197

,

4



)

0014


,

0

(



log

0014


,

0

...



)

0929


,

0

(



log

0929


,

0

)



1339

,

0



(

log


1339

,

0



)

(

2



2

2

1



1









H

H

Произведем  анализ  данного отрывка на казахском  языке,  который также содержит

30000   знаков   с   пробелами,   без   пробелов   –   25980.   Для   более   точного   вычисления

информации,   содержащейся   в   одной   букве   казахского   текста,   надо   знать   вероятности

появления   различных   букв.   Эти   вероятности   можно   приближенно   определить,   взяв

достаточно  большой   отрывок   и  рассчитав   для  него   относительные  частоты   отдельных

букв. 

Так как казахский алфавит содержит 43 буквы (42 буквы, 1 пробел), то согласно этому



результату:

4

,



5

43

log





Ho

 бит.

-   энтропия   опыта,   заключающегося   в   приеме   одной   буквы   казахского   текста



(информация,   содержащаяся   в   одной   букве),   при   условии,   что   все   буквы   считаются

одинаково вероятными.

Рассчитаем   для   него   относительные   частоты   отдельных   букв.   Ориентировочные

значения частот отдельных букв казахского языка представлены в таблицах 3 и 4 (тире

здесь обозначает пробел между словами). В таблице 3 буквы расположены в алфавитном

порядке, в таблице 4 – по мере убывания относительных частот.

Таблица 3. Вычисление относительной частоты в алфавитном порядке


Таблица 4. Расположение относительной частоты одной буквы в порядке убывания 

буква


относ.частота

__

0,134


а

0,1138


ы

0,0725


н

0,0616


е

0,0601


р

0,0565


л

0,0491


і

0,0468


буква

т

с



д

қ

о



к

б

ғ



Буква

Относительная

частота



Буква

Относительная

частота

1.

пробел

0,134

23

п

0,0124


2.

а

0,1138


24

р

0,0565


3.

ә

0,007


25

с

0,0368


4.

б

0,0224


26

т

0,0445


5.

в

0,0018


27

у

0,0113


6.

г

0,0088


28

ұ

0,0087


7.

ғ

0,0179


29

ү

0,0084


8.

д

0,0367


30

ф

0,0009


9.

е

0,0601


31

х

0,0019


10.

ё

0,0002


32

һ

0,0002


11.

ж

0,0152


33

ц

0,0009


12.

з

0,0120


34

ч

0,0001


13.

и

0,0083


35

ш

0,0148


14.

й

0,0115


36

щ

0

15.



к

0,0237


37

ъ

0

16.



қ

0,0296


38

ы

0,0725


17.

л

0,0491


39

і

0,0468


18.

м

0,0150


40

ь

0,0003


19.

н

0,0616


41

э

0,0003


20.

ң

0,0170


42

ю

0,0002


21.

о

0,0252


43

я

0,0021


22.

ө

0,0088


относ.частота

0,0445


0,0368

0,0367


0,0296

0,0252


0,0237

0,0224


0,0179

буква


относ.частота

ң

0,0170



ж

0,0152


м

0,0150


ш

0,0148


п

0,0124


з

0,0120


й

0,0115


у

0,0113


буква

относ.частота

г

0,0088


ө

0,0088


ұ

0,0087


ү

0,0084


и

0,0083


ә

0,007


я

0,0021


х

0,0019


буква

относ.частота

в

0,0018


ф

0,0009


ц

0,0009


ь

0,0003


э

0,0003


ю

0,0002


ё

0,0002


һ

0,0002


буква

относ.частота

ч

0,0001


щ

0

ъ



0

Приравняв   эти   частоты   вероятностям   появления   соответствующих   букв,

получим на основании информационной энтропии Шеннона формулу для расчета

максимального значения энтропии текста при учете одной буквы казахского текста

(отрывок):

)

ln



ln

(

log



)

(

1



1

a

b

b

b

b

H

H

a







:

459


,

4

)



0001

,

0



(

log


0001

,

0



...

)

1138



,

0

(



log

1138


,

0

)



134

,

0



(

log


134

,

0



)

(

2



2

2

1



1









H

H

Таким   образом,   используя   классическую   формулу   определения   вероятности,   мы

получили   для   энтропии   одной   буквы   казахского   текста   приближенное   значение

459


,

4

1





H

  бит. Из сравнения этого значения с величиной  

4

,

5



43

log




Ho

  бит видно,

что   неравномерность   появления   различных   букв   казахского   алфавита,   как   и   русского,

приводит к уменьшению информации, содержащейся в одной букве казахского текста,

примерно на 0,95 бит.

5

32

log



0



H

 в русском языке

4

,

5



43

log




Ho

 в казахском языке

4197


,

4

1





H

 в русском языке

459

,

4



1



H

 в казахском языке

Отсюда можно заключить, что динамика энтропии текста уменьшается при переходе

на более высокий уровень организации, при этом увеличивается информационная емкость

текста,   что   подтверждает   развитие   языка   по   закону   сохранения   суммы   информации   и

энтропии.


Согласно   полученным   данным,   текст,   обладающий   присущими   ему   признаками,   а

именно: информативностью, связностью, завершенностью, отличающийся по стилевой и

жанровой окраске, строится по определенным законам, которые оказывают воздействие

на наличие информации и энтропии в тексте. 

В   рамках   исследования   нами   представлена   попытка   теоретического   обоснования

возможности   и   необходимости   применения   синергетической   парадигмы   к

анализу лингвистического текста,   разработана   лингво-математическая   модель   текста   на

основе   формулы   К.Шеннона.   Мы   попытались   продемонстрировать   возможность

применения синергетического подхода к анализу текста в русском и казахском языках.

Результаты   исследования   еще   раз   подтвердили,   что   синергетика   объясняет   эволюцию

любой сложной диссипативной системы саморазвитием.

Таким   образом,   применение   энтропии   в   лингвистике   является   одним   из   наиболее

универсальных   характеристик   текста,   показателем   его   сложности   в   энтропийно-

информационном смысле. Поэтому текст является сложным многоуровневым объектом

синергетики, обладающим энергией и внутренней жизнью. 

ЛИТЕРАТУРА

1 Пономарёва А. И. Вопросы истории народного хозяйства и экономической мысли.

ИСТОКИ. Т.1. 1989г. – С.227.

2 Жанабаев З.Ж. Синергетическое будущее лингвистики // Высшая школа Казахстана,

2000. № 6. С. 135-142.

3   Пищальникова   В.А.,   Сонин   А.Г.,   Тимофеева   М.К.   Современные   парадигмы

языкознания. – М.: АСОУ, ИНИОН РАН, – 72 с.

4 Белоусов К.И., Москальчук Г.Г. О моделировании внутритекстовых пространств//

Вестник ОГУ, №11, 2004. – С. 126-129.

5   Мышкина   Н.Л. Внутренняя   жизнь   текста:  механизмы,  формы,  характеристики.

Пермь: Изд-во Перм. Гос. Техн. Ун-та, 1998. — 152 с. 

6  Шеннон  К. Э. Математическая  теория  связи  //  Работы  по теории  информации  и

кибернетике. – М.: ИЛ, 1963. – С. 243-332.

7 М.М. Мендикулов. К характеристике архитектуры Казахстана 19 и начала 20 века //

Маргулан А. Х., Басенов Т. К., Мендикулов М. М. Архитектура Казахстана. – Алматы:

Издательство «Онер», 1 том, 2010. – 256с.



REFERENSES

1. Ponomareva A.I. The issues of history of the national economy and economic thought.

ISTOKI. V.1. 1989. – P.227.

2 Zhanabaev Z.Zh. Synergetic future of linguistics // The higher school of Kazakhstan, 2000.

№ 6. P. 135-142.

3 Pischalnikova V.A., Sonin A.G., Timofeeva M.K. Modern paradigm of linguistics. – М.:

АSОU, INION RAN, – 72 p.

4 Belousov K.I., Moskalchuk G.G. About modeling intra-text spaces // Bulletin ОSU, №11,

2004. – P. 126-129.

5 Myshkina N.L. The inner life of the text: mechanisms, forms and characteristics.  Perm:

Publ. Perm. State Tech.Univ-ty, 1998. — 152 p. 

6  Shennon K.E. The mathematical theory of communication // The works on information

theory and cybernetics.– М.: IL, 1963. – P. 243-332.

7 М.М. Mendikulov. The characteristic architecture of Kazakhstan 19 and beginning of 20

century  //  Margulan A.Kh., Basenov T.K., Mendikulov M.M. Architecture of Kazakhstan. –

Almaty: Publ. «Oner», 1 volume, 2010. – 256p.

Резюме

Б.Р. Оспанова, С.Ш. Қажыкенова, Н.А. Қасенова

(Қарағанды мемлекеттік техникалық университеті;

Е.А. Бөкетов атындағы Қарағанды мемлекеттік университеті, Қарағанды, Қазақстан)

ЭНТРОПИЯНЫҢ ЛИНГВОСИНЕРГЕТИКАДАҒЫ ҚОЛДАНЫЛУЫ

Мақалада   лингвосинергетикадағы   энтропиялық   сынауды   қолдану   мәселелері

қарастырылған.   Синер-гетика   –   тәртіпаралық   ғылыми   бағытта   негізгі   мәселе   ретінде

талдалған.

Мәтін   жиынтығы   табиғи   бақылау   нысанасы   ретінде,   көп   дәрежелі   синергетикалық

жүйе   ретінде   қарастырылған.   Оның   құрамы   көп   аспектілік   шегінде   талданған.   Кейбір

энтропиялық мәтіндердің есептеулі мазмұндалған, эксперименттік мәліметтер келтірілген

нәтижелері   көрсетілген.   Бағалау   ақпаратты   және   энтропия   заңын   сақтау   негізінде

Шеннонның   формуласын   қолдана   отырып,   мәтіннің   құрылысы   лингво-математикалық



жоба   үшін   ұсынылады,   сонымен   қатар   орыс   тілі   және   қазақ   тілінде   салыстырмалы-

теңестіру талдауы беріледі. 

Ұсынылған   әдістеме   жүйелік   тілдің   көп   дәрежелі   қиын   иерархиялық   жүйесінің

негізінде құрастырылған. 



Кілт   сөздер:  энтропия,   лингвосинергетика,   мәтін,   өзін   –   өзі   ұйымдастыру   жүйесі,

қатыстық жиілік, есептеу, ақпарат, бит, нысан, көп дәрежелі.



Summary

B.R.Ospanova, S.SH.Kazhikenova, N.A.Kasenova

(Karaganda state technical university;

Karaganda state university named after E.A.Buketov, Karaganda, Kazakhstan)

THE USE OF ENTROPY IN LINGUASINERGETICS

The paper deals with the application of entropy criteria in the lingua-synergetic. The key

problems of synergy are analyzed as an interdisciplinary scientific direction.

The text is considered as an integrated natural object, as a complex of multi-level synergetic

system. Its structure is analyzed in the framework under many aspects. Some aspects of the

experimental approach of calculation of the texts entropy are outlined, the experimental data are

given, which shows the results. It is proposed linguistic-mathematical model for the analysis of

text   structure,   built   on   the   basis   of   the   fundamental   law   of   conservation   of   the   sums   of

information and entropy with use of Shannon’s formula, as well as a comparative-contrastive

analysis of entropy characteristics of texts in Russian and Kazakh languages.

The proposed methodology is based on a systematic, multi level approach to the construction

of a complex hierarchical system of a language.

Key words: entropy, lingua-synergetic, text, self-organizing system, the relative frequency,

evaluation, information, bit, object, multi-level.



Поступила 08.04.2013 г.


Достарыңызбен бөлісу:




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет