2.6 Ақпарат мӛлшерінің бірліктері
«Ақпарат мӛлшері» ҧғымын анықтау ӛте қиын. Бҧл мәселені шешу екі
негізгі тҧрғыда қарастырылды. ХХ ғасырдың 40-жылдары кибернетиканың
негізін салушы Клод Шеннон бҧл мәселені ықтималдық тҧрғыдан қарастырды.
Ықтималдық тұрғы
Мысал ретінде N жағы бар дҧрыс ойын сҥйегін лақтырумен байланысты
тәжірибені қарастырайық (кӛбінесе N=6). Тәжірибе нәтижесі тӛмендегідей
болуы мҥмкін: яғни 1, 2, ..., N белгілерінің бірі бар жақпен тҥсу.
Анықталмағандықты ӛлшейтін H – энтропия сандық шамасын енгіземіз. N
және H қандай да бір функциялық байланыста: H=f(N) (1.1)
Ал f - ӛспелі N=1..6 ҥшін анықталған функция.
Сҥйекті лақтыру процедурасы нақтырақ:
1) сҥйекті лақтыруға дайындық;
тәжірибе нәтижесі белгісіз, яғни анықталмағандық - H1 шамасын
енгіземіз.
2) сҥйек лақтырылды;
тәжірибе нәтижесі туралы ақпарат алынды, оның мӛлшерін І деп
белгілейміз
3) тәжірибе іске асырылғаннан кейінгі анықталмағандық - H2.
23
Осы тәжірибені жҥзеге асыру кезіндегі ақпарат мӛлшері ретінде
тәжірибеге ―дейін‖ және ―кейінгі‖ белгілердің айырымын аламыз:
І=H1-H2
(1.2)
Егер нақты нәтиже алынса, яғни H2=0 болса, онда І=Н1, яғни бастапқы
энтропияға тең.
Басқаша айтқанда, тәжірибедегі анықталмағандық - сол тәжірибенің
нәтижесі туралы ақпаратпен беттеседі.
Енді (1.1)-дегі f функциясының тҥрін анықтау қажет. Егер N жақ пен
лақтыру саны –M десек, онда жалпы нәтиже саны: X=N
M
(1.3)
Мысалы, 6 жақты сҥйекті екі рет лақтырғанда Х=6
2
=36, яғни әрбір Х – (х1,
х2) жҧбы болып табылады: х1 – бірінші лақтыру, х2 – екінші лақтыру.
(1.3)-ке логарифм т.б. әрекеттер қолданып,
H=log
2
N (1.4) (Хартли)
және H= P
і
log
2
(1/P
і
) (1.5) (Шеннон) формулаларын аламыз.
Мысалдар:
1) Орыс тілінде жазылған сӛздегі әр символдың пайда болуына
байланысты ақпарат мӛлшері: орыс алфавитінде 33 әріп және ашық орын
белгісін есептегенде: (1.4) бойынша, H=log
2
34
5,09 бит.
2) Латын, француз, неміс т.б. тілдерде 26 әріп және ашық орын белгісін
есептегенде: H=log
2
27
4,76 бит.
3) 0, 1 алфавитінде H=log
2
2=1 бит.
Көлемдік тұрғы
Екілік санау жҥйесінде 0, 1 таңбалары бит (bіnary dіgіt – екілік цифр) деп
аталады. Компьютер қҧрастырушылар осы екілік жҥйені қолданады, ӛйткені
техникалық қҧрылғыларда екі әр тҥрлі қарама-қарсы кҥйді (қалыпты) оңай
жҥзеге асыруға болады: мысалы, қандай да бір физикалық элементтің екі
бағытта магниттелуі немесе прибордың электр тогын ӛткізу - ӛткізбеуі,
конденсатордың зарядталған – зарядталмағаны т.б.
Компьютерде бит – ең аз мҥмкін ақпарат бірлігі. Компьютер жадысында
немесе сыртқы жадыда екілік таңбамен жазылған ақпарат кӛлемі осы жазуға
қажет екілік символдардың санымен саналады. Ықтималдық тҧрғымен
салыстырғанда мҧнда биттердің бҥтін емес саны болмайды.
Ақпараттың кӛлемі деп – хабардың ҧзындығын, яғни хабарды жазу ҥшін
пайдаланылған символдар санын айтады. Есептеуіш техникада кез келген
хабардың жазылуы екілік алфавитте жасалатыны мәлім. Осылай қарастырғанда
ақпараттың ең кіші ӛлшем бірлігі екілік разрядқа немесе 1 битке тең болады.
Одан қолайырақ ӛлшем бірлігі - сегіз екілік разрядтың жиынтығы – 1
байт, ол символдарды кодтауда жиі қолданылады.
Бір байт 8 битке тең.
1 байт=8 бит;
1Кбайт (килобайт) =1024 байт≈1000 байт;
1Мбайт(мегабайт)=1024Кбайт≈1(миллион байт)
1Гбайт(гигабайт)=1024Мбайт≈1(миллиард байт).
1 Тбайт (терабайт)=1024 Гбайт.
Кӛлемі 100 Мегабайт жадқа тӛмендегілерді орналастыруға болады:
24
- 50000 беттік мәтінді:
- 150 тҥсті слайдты:
- 1,5 сағаттық сӛздік аудио жазбаны:
- 10 минуттық стерео музыкалық ҥзіндіні:
- 15 секундтық фильмді:
- Wіndows98, 2000, Word 97 бағдарламаларын.
Достарыңызбен бөлісу: |