Кибернетический (алфавитный) подход к измерению информации
Изучаемые вопросы:
♦ Что такое алфавит, мощность алфавита.
♦ Что такое информационный вес символа в алфавите.
♦ Как измерить информационный объем текста с алфавитной
точки зрения.
♦ Что такое байт, килобайт, мегабайт, гигабайт.
♦ Скорость информационного потока и пропускная способ
ность канала.
Рассматриваемый в этой теме подход к измерению информа
ции является альтернативным к содержательному подходу, об
суждавшемуся ранее. Здесь речь идет об измерении количества ин
формации в тексте (символьном сообщении), составленном из сим
волов некоторого алфавита. К содержанию текста такая мера
информации отношения не имеет. Поэтому такой подход можно
назвать объективным, т.е. не зависящим от воспринимающего его
субъекта.
Алфавитный подход — это единственный способ измерения
информации, который может применяться по отношению к ин
формации, циркулирующей в информационной технике, в ком
пьютерах.
Опорным в этой теме является понятие алфавита. Алфавит —
это конечное множество символов, используемых для представления
информации. Число символов в алфавите называется мощностью
алфавита (термин взят из математической теории множеств). В
основном содержании базового курса алфавитный подход рассмат
ривается лишь с позиции равновероятного приближения. Это зна
чит, что допускается предположение о том, что вероятности по
явления всех символов алфавита в любой позиции в тексте одина
ковы. Разумеется, это не соответствует реальности и является
упрощающим предположением.
В рассматриваемом приближении количество информации,
которое несет в тексте каждый символ (/), вычисляется из урав
137
нения Хартли: 2' = N, где N — мощность алфавита. Величину /
можно назвать информационным весом символа. Отсюда следует,
что количество информации во всем тексте (/), состоящем из К
символов, равно произведению информационного веса символа
на К : I = i х К. Эту величину можно назвать информационным
объемом текста. Такой подход к измерению информации еще на
зывают объемным подходом.
Полезно обсудить с учениками следующий вопрос: какова ми
нимальная мощность алфавита, с помощью которого можно за
писывать (кодировать) информацию? Этот вопрос напрямую свя
зан с заданием № 3 к § 3 учебника [11], которое звучит так: «До
кажите, что исходя из алфавитного подхода, сообщение любой
длины, использующее односимвольный алфавит, содержит нуле
вую информацию».
Предположим, что используемый алфавит состоит всего из
одного символа, например «1». Интуитивно понятно, что сооб
щить что-либо с помощью единственного символа невозможно.
Но это же доказывается строго с точки зрения алфавитного под
хода. Информационный вес символа в таком алфавите находится
из уравнения: 2' = 1. Но поскольку 1 = 2°, то отсюда следует, что
/ = 0 бит. Полученный вывод можно проиллюстрировать следую
щим образным примером. Представьте себе толстую книгу в
1000 страниц, на всех страницах которой написаны одни едини
цы (единственный символ используемого алфавита). Сколько ин
формации в ней содержится? Ответ: нисколько, ноль. Причем та
кой ответ получается с любой позиции, как с содержательной,
так и с алфавитной.
Минимальная мощность алфавита, пригодного для передачи ин
формации, равна 2. Такой алфавит называется двоичным алфавитом.
Информационный вес символа в двоичном алфавите легко опре
делить. Поскольку 2' = 2, то / = 1 бит. Итак, один символ двоичного
алфавита несет 1 бит информации. С этим обстоятельством учени
ки снова встретятся, когда будут знакомиться с алфавитом внут
реннего языка компьютера — языка двоичного кодирования.
Бит — основная единица измерения информации. Кроме нее
используются и другие единицы. Следует обратить внимание уче
ников на то, что в любой метрической системе существуют еди
ницы основные (эталонные) и производные от них. Например,
основная физическая единица длины — метр. Но существуют мил
лиметр, сантиметр, километр. Расстояния разного размера удобно
выражать через разные единицы. Так же обстоит дело и с измере
нием информации. 1 бит — это исходная единица. Следующая по
величине единица — байт. Байт вводится как информационный
вес символа из алфавита мощностью 256. Поскольку 256 = 28, то
1 байт = 8 бит. Мы снова встречаемся с темой, которая является
своеобразной пропедевтикой к будущему изучению компьютера.
138
Уже в рамках данной темы можно сообщить ученикам, что компь
ютер для внешнего представления текстов и другой символьной ин
формации использует алфавит мощностью 256 (во внутреннем пред
ставлении любая информация в компьютере кодируется в двоич
ном алфавите). Фактически, для выражения объема компьютерной
информации в качестве основной единицы используется байт.
Представляя ученикам более крупные единицы: килобайт, мега
байт, гигабайт — нужно обратить их внимание на то, что мы при
выкли приставку «кило» воспринимать, как увеличение в 1000 раз.
В информатике это не так. Килобайт больше байта в 1024 раза, а
число 1024 = 210. Так же относится и «мега» по отношению к «кило»
и т.д. Тем не менее часто при приближенных вычислениях ис
пользуют коэффициент 1000.
В рамках углубленного курса учитель может изложить алфавит
ный подход в более адекватном варианте, без допущения равно
вероятности символов. Теоретический и практический материал
на эту тему можно найти в пособии [8] в подразделе 1.4.
Достарыңызбен бөлісу: |