нения Хартли: 2' =
N, где
N — мощность алфавита. Величину /
можно назвать информационным весом символа. Отсюда следует,
что количество информации во всем тексте (/), состоящем из
К
символов, равно произведению информационного веса символа
на
К : I = i х
К. Эту величину можно назвать информационным
объемом текста. Такой подход к измерению информации еще на
зывают
объемным подходом.
Полезно обсудить с учениками следующий вопрос: какова ми
нимальная мощность алфавита, с помощью которого можно за
писывать (кодировать) информацию? Этот
вопрос напрямую свя
зан с заданием № 3 к § 3 учебника [11], которое звучит так: «До
кажите, что исходя из алфавитного подхода, сообщение любой
длины, использующее односимвольный алфавит, содержит нуле
вую информацию».
Предположим, что используемый алфавит состоит всего из
одного символа, например «1». Интуитивно понятно, что сооб
щить что-либо с помощью единственного символа невозможно.
Но это же доказывается строго с точки зрения алфавитного под
хода. Информационный вес символа в таком алфавите находится
из уравнения: 2' = 1. Но поскольку 1 = 2°, то отсюда следует, что
/ = 0 бит. Полученный вывод можно проиллюстрировать следую
щим образным примером. Представьте себе толстую книгу в
1000 страниц, на всех страницах которой написаны одни едини
цы (единственный символ используемого алфавита). Сколько ин
формации в ней содержится? Ответ: нисколько, ноль. Причем та
кой ответ получается с любой позиции, как с содержательной,
так и с алфавитной.
Минимальная мощность алфавита, пригодного для передачи ин
формации, равна 2. Такой алфавит называется
двоичным алфавитом.
Информационный вес символа в двоичном алфавите легко опре
делить. Поскольку 2' = 2, то / = 1 бит. Итак,
один символ двоичного
алфавита несет 1 бит информации. С
этим обстоятельством учени
ки снова встретятся, когда будут знакомиться с алфавитом внут
реннего языка компьютера — языка двоичного кодирования.
Бит — основная единица измерения информации. Кроме нее
используются и другие единицы. Следует обратить внимание уче
ников на то, что в любой метрической системе существуют еди
ницы основные (эталонные) и производные от них. Например,
основная физическая единица длины — метр. Но существуют мил
лиметр, сантиметр, километр. Расстояния разного размера удобно
выражать через разные единицы. Так же обстоит дело и с измере
нием информации. 1 бит — это исходная единица. Следующая по
величине единица — байт. Байт вводится как информационный
вес символа из алфавита мощностью 256. Поскольку 256 = 28, то
1 байт = 8 бит. Мы снова встречаемся с темой, которая является
своеобразной пропедевтикой к будущему изучению компьютера.
138
Уже в рамках данной темы можно сообщить ученикам, что
компь
ютер для внешнего представления текстов и другой символьной ин
формации использует алфавит мощностью 256 (во внутреннем пред
ставлении любая информация в компьютере кодируется в двоич
ном алфавите). Фактически, для выражения объема компьютерной
информации в качестве основной единицы используется байт.
Представляя ученикам более крупные единицы: килобайт, мега
байт, гигабайт — нужно обратить их внимание на то, что мы при
выкли приставку «кило» воспринимать, как увеличение в 1000 раз.
В информатике это не так. Килобайт больше байта в 1024 раза, а
число 1024 = 210. Так же относится и «мега» по отношению к «кило»
и т.д. Тем не менее часто при приближенных вычислениях ис
пользуют коэффициент 1000.
В рамках углубленного курса учитель может изложить алфавит
ный подход в более адекватном варианте, без допущения равно
вероятности символов. Теоретический и практический материал
на эту тему можно найти в пособии [8] в подразделе 1.4.
Достарыңызбен бөлісу: