В ы с ш е е о б р а з о в а н и е м. П. Лапчик, И. Г. Семакин, Е. К. Хеннер


Кибернетический  (алфавитный)  подход к измерению информации



Pdf көрінісі
бет114/437
Дата23.01.2022
өлшемі32,34 Mb.
#24228
1   ...   110   111   112   113   114   115   116   117   ...   437
Кибернетический  (алфавитный)  подход к измерению информации
Изучаемые вопросы:
♦  Что такое  алфавит,  мощность алфавита.
♦  Что  такое  информационный  вес  символа  в  алфавите.
♦  Как  измерить  информационный  объем  текста с  алфавитной 
точки  зрения.
♦  Что  такое  байт,  килобайт,  мегабайт,  гигабайт.
♦  Скорость  информационного  потока  и  пропускная  способ­
ность канала.
Рассматриваемый  в  этой  теме  подход  к  измерению  информа­
ции  является  альтернативным  к  содержательному  подходу,  об­
суждавшемуся  ранее.  Здесь речь идет  об измерении количества  ин­
формации  в тексте  (символьном  сообщении),  составленном  из  сим­
волов  некоторого  алфавита.  К  содержанию  текста  такая  мера 
информации  отношения  не  имеет.  Поэтому  такой  подход  можно 
назвать объективным, т.е. не зависящим от воспринимающего его 
субъекта.
Алфавитный  подход  —  это  единственный  способ  измерения 
информации,  который  может  применяться  по  отношению  к  ин­
формации,  циркулирующей  в  информационной  технике,  в  ком­
пьютерах.
Опорным  в этой теме является  понятие  алфавита. Алфавит  — 
это конечное множество символов,  используемых для представления 
информации.  Число  символов  в  алфавите  называется  мощностью 
алфавита  (термин  взят  из  математической  теории  множеств).  В 
основном содержании базового курса алфавитный подход рассмат­
ривается лишь с  позиции равновероятного  приближения.  Это  зна­
чит,  что  допускается  предположение  о  том,  что  вероятности  по­
явления всех символов алфавита в любой позиции в тексте одина­
ковы.  Разумеется,  это  не  соответствует  реальности  и  является 
упрощающим  предположением.
В  рассматриваемом  приближении  количество  информации, 
которое  несет  в  тексте  каждый  символ  (/),  вычисляется  из  урав­
137


нения  Хартли:  2'  =  N,  где    —  мощность  алфавита.  Величину  / 
можно назвать информационным весом символа.  Отсюда следует, 
что  количество  информации  во  всем  тексте  (/),   состоящем  из  К 
символов,  равно  произведению  информационного  веса  символа 
на  К : I   =  i  х К.  Эту  величину  можно  назвать  информационным 
объемом текста. Такой подход к измерению информации еще  на­
зывают объемным  подходом.
Полезно обсудить с учениками следующий вопрос:  какова ми­
нимальная  мощность  алфавита,  с  помощью  которого  можно  за­
писывать (кодировать) информацию? Этот вопрос напрямую свя­
зан  с  заданием № 3  к § 3 учебника  [11],  которое  звучит так:  «До­
кажите,  что  исходя  из  алфавитного  подхода,  сообщение  любой 
длины,  использующее  односимвольный алфавит,  содержит нуле­
вую  информацию».
Предположим,  что  используемый  алфавит  состоит  всего  из 
одного  символа,  например  «1».  Интуитивно  понятно,  что  сооб­
щить  что-либо  с  помощью  единственного  символа  невозможно. 
Но  это  же доказывается  строго  с точки  зрения  алфавитного  под­
хода.  Информационный  вес символа в таком алфавите находится 
из уравнения:  2' =  1.  Но  поскольку  1  = 2°,  то  отсюда следует,  что 
/ = 0  бит.  Полученный  вывод можно проиллюстрировать следую­
щим  образным  примером.  Представьте  себе  толстую  книгу  в 
1000 страниц,  на  всех  страницах  которой  написаны  одни  едини­
цы  (единственный символ используемого алфавита).  Сколько ин­
формации в ней содержится? Ответ: нисколько,  ноль.  Причем та­
кой  ответ  получается  с  любой  позиции,  как  с  содержательной, 
так  и  с  алфавитной.
Минимальная  мощность  алфавита,  пригодного  для  передачи  ин­
формации, равна 2. Такой алфавит называется двоичным алфавитом. 
Информационный вес символа в двоичном алфавите легко опре­
делить.  Поскольку 2'  = 2, то  / =  1  бит.  Итак,  один символ двоичного 
алфавита несет 1 бит информации. С этим обстоятельством учени­
ки  снова  встретятся,  когда будут знакомиться  с  алфавитом  внут­
реннего  языка  компьютера  —  языка двоичного  кодирования.
Бит  —  основная  единица  измерения  информации.  Кроме  нее 
используются и другие единицы.  Следует обратить внимание уче­
ников  на то,  что  в любой  метрической  системе  существуют  еди­
ницы  основные  (эталонные)  и  производные  от  них.  Например, 
основная физическая единица длины — метр. Но существуют мил­
лиметр, сантиметр,  километр.  Расстояния разного размера удобно 
выражать через разные единицы. Так же обстоит дело и с измере­
нием информации.  1  бит  — это исходная единица.  Следующая  по 
величине  единица  —  байт.  Байт  вводится  как  информационный 
вес  символа  из  алфавита мощностью  256.  Поскольку 256  = 28,  то 
1  байт  =  8  бит.  Мы снова  встречаемся  с темой,  которая  является 
своеобразной  пропедевтикой  к  будущему  изучению  компьютера.
138


Уже в рамках данной темы можно сообщить ученикам, что компь­
ютер для внешнего представления текстов и другой символьной  ин­
формации использует алфавит мощностью 256 (во внутреннем пред­
ставлении любая  информация в  компьютере  кодируется в двоич­
ном алфавите). Фактически, для выражения объема компьютерной 
информации в качестве  основной  единицы  используется  байт.
Представляя ученикам более крупные единицы: килобайт,  мега­
байт,  гигабайт —  нужно  обратить их внимание  на то,  что  мы  при­
выкли  приставку «кило»  воспринимать,  как увеличение в  1000 раз. 
В  информатике это  не  так.  Килобайт больше  байта  в  1024 раза,  а 
число  1024  = 210. Так же относится и «мега» по отношению к «кило» 
и  т.д.  Тем  не  менее  часто  при  приближенных  вычислениях  ис­
пользуют коэффициент  1000.
В рамках углубленного курса учитель может изложить алфавит­
ный  подход  в  более  адекватном  варианте,  без допущения  равно­
вероятности  символов.  Теоретический  и  практический  материал 
на  эту тему  можно  найти  в  пособии  [8]  в  подразделе  1.4.


Достарыңызбен бөлісу:
1   ...   110   111   112   113   114   115   116   117   ...   437




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет