Екі əріптен тұратын блоктарды кодтау
Блоктар
Ықтималдықтар
Кодтық комбинациялар
Бөліктеу сатысы
z1 z1
0,81
1
z1 z2
0,09
01
I
z2 z1
0,09
001
II
z2 z2
0,01
000
III
Өйткені əріптер статистикалық тұрғыдан байланыспаған, блок-
тар ықтималдықтары əріптерді құрайтын ықтималдықтардың
көбейтіндісі ретінде анықталады. Блокқа символдардың орташа
саны 1,29-ға тең болып, ал əріпке 0,645-ке тең болып алынады. Үш
əріптен тұратын блоктарды кодтау, одан да үлкен эффект береді.
Сəйкес ансамбль мен кодтар 9-кестеде берілген.
9-кесте.
Үш əріптен тұратын блоктарды кодтау
Блоктар
Ықтималдықтар
Кодтық комбинациялар
Бөліктеу сатысы
z1z1z1
0,729
1
z2z1z1
0,081
011
I
z1z2z1
0,081
100
III
z1z1z2
0,081
010
II
z2z2z1
0,009
00011
IV
z2z1z2
0,009
00010
VI
z1z2z2
0,009
00001
V
z2z2z2
0,001
00000
VII
343
Блокқа символдардың орташа саны 1,59-ға, əріпке – 0,53-ке
тең, барлығы энтропиядан 12%-ға үлкен. Н(z)=0,47 теориялық
минимумға əріптердің шексіз саны кіретін блоктарды кодтау кезінде
жетуге болады:
)
z
(
H
l
lim
n
(182)
Блоктарды ірілендіру кезінде кодтаудың тиімділігін арттыру аса
алыс статистикалық байланыстарды ескерумен байланысты емес
екенін атап көрсету қажет, өйткені біз, алфавиттерді корреляциялық
əріптермен қарастырдық. Тиімділікті арттыру блоктарды ірілендіру
кезінде алынатын ықтималдықтар жиынын жиын ықтималдықтар
бойынша неғұрлым жақын ішкі топтарға бөлуге болатындығымен
ғана анықталады.
ҚОРЫТЫНДЫ
• Тура теоремалар дəлелдемелерінің қарастырылған екі
нұсқасы бірқалыпты жəне бірқалыпты емес кодтауды пайдалануға
негізделген тиімді кодтарды құрудың екі мүмкін тəсілдемесін су-
ретпен көрсетеді. Бірқалыпты емес кодтау кезінде бүкіл хабарларды
бірмəнді декодтау қамтамасыз етіледі.
• Дискреттік хабарлардың кез келген көзі үшін (яғни,
ықтималдықтарды кез келген көпөлшемді бөлумен сипатталатын)
мінсіз арна бойынша ақпараттарды беру жылдамдығы ақпараттарды
жоғалтпаған кезде арнаның өткізу қабілетіне барынша жақын болып
жасалу мүмкіндігі туындайды.
• Арнада шуылдың болуымен шарттасылған қателерді соның
көмегімен жоюға болатын кодтауды кедергіге төзімді деп атайды.
Қателерді түзетуге жəне анықтауға қабілетті кодтар да кедергіге
төзімді код деп аталады.
• Аналогтық-кодтық түрлендіргіштер, құрама есептеу
машиналарындағы негізгі блоктар болып саналады, мұнда ақпарат
аналогтық жəне цифрлық екі түрде көрсетіледі. Өйткені цифрлық
есептеу машиналары бірнеше микросекундтағы уақыт ішінде
қарапайым операцияларды орындайды, сондықтан оған арналған
аналогтық-кодтық түрлендіргіштер осындай жылдамдықпен жұмыс
істеуге тиіс.
• Аналогтық шамалардың үзіліссіз тізбектілігін дискреттік
344
мəндердің түпкі санымен ауыстыруға жəне оларды берілген код-
та көрсетуге мүмкіндік беретін құрылғы, аналогтық-кодтық
түрлендіргіштер атауын алды.
СОӨЖ жəне СӨЖ тапсырмалары
1. Тақырып бойынша бақылау сұрақтарына жауап беру:
1. Арнадағы
ақпараттарды
беру
жылдамдығы
қалай
анықталады?
2. Дискретік
көздердің
артықтылығы
қандай
себептермен
шарт-
тасылады?
3. Алынған
нəтиже
бойынша
энтропияның
қандай
түсіндірмесі
алынады?
4. Кедергіге төзімді кодтарды қандай кластарға бөлуге болады?
5. Аналогтық-кодтық түрлендіргіштер қандай топтарға бөлінеді?
2. Тақырып бойынша тест тапсырмаларының сұрақтарына
жауап беру:
1.
Қай модель ағаш құрылымын білдіретін, жоғарыдан төмен
қарай бағыну тəртібімен орналасқан элементтер жиыны?
A)
Желілік
B)
Иерархиялық
C)
Дерек
D)
Сызықтық
E)
Циклдік
2.
Қандай модель деректер құрылымы мен оларды өңдеу
операциясының жиынтығы?
A)
Желілік
B)
Иерархиялық
C)
Дерек
D)
Сызықтық
E)
Циклдік
3.
Қай режимде белгіленген уақыт мерзімі болмайынша жəне
деректер көлемі қандай да бір шектен асып кетпейінше жүйеге
деректер жинала береді?
345
A)
Диалогтық
B)
Циклдік
C)
Желілік
D)
Пакеттік
E)
Есептеуіш
4.
андай режим кезінде жұмыс қолданушы мен жүйе арасында
мағлұмат алмасу ретінде жүргізіледі?
A)
Есептеуіш
B)
Циклдік
C)
Желілік
D)
Пакеттік
E)
Диалогтық
5.
Кейбір құбылыстың, процестің немесе құбылыстың жеке
қасиетінің ақпараттық кескінін не деп атайды?
A)
Атрибут
B)
Субъект
C)
Жүйе
D)
Элемент
E)
Модель
6.
Кез келген құрылымды АҚБ-нің екі деңгейлік құрылымға өту
операциясы қалай аталады?
A)
Композиция
B)
Нормализация
C)
Декомпозиция
D)
Құрылым
E)
Индекстеу
7.
Алдын ала қойылған іріктеу шартын қанағаттандыратын АҚБ
мəндерінің көпшесін бөлу операциясы қалай аталады?
A)
Түрлендіру
B)
Индекстеу
C)
Іріктеу
D)
Пайдаға асыру
E)
Жобалау
8.
Қай база бір немесе бірнеше деректер базасынан тұрады?
A)
Деректер
Қ
346
B)
Реляциялық
C)
Жүйелік
D)
Ақпараттық
E)
Пакеттік
9.
Қай деректер базасы барлық деректер кесте түрінде жасалып
қолданушыға түсінікті болатын, ал деректермен орындалатын
барлық операциялар осы кестеде орындалатын операцияға тəн
болатын деректер базасы болып табылады?
A)
Деректер
B)
Пакеттік
C)
Жүйелік
D)
Ақпараттық
E)
Реляциялық
10.
Деректер базасы:
A)
Сəйкес материалдық жүйе үшін жалған болады
B)
Сəйкес емес материалдық жүйе үшін ақиқат болады
C)
Сəйкес емес материалдық жүйе үшін жалған болады
D)
Дұрыс жауабы жоқ
E)
Сəйкес материалдық жүйе үшін ақиқат болып табылады
11.
Атрибут -
A)
Кейбір құбылыстың не үрдістің жеке қасиеттерінің ақпараттық
кескіні
B)
Мəліметтердің материалдық кескіні
C)
Сақталатын құжаттардың кескіні
D)
Деректер жинағы
E)
Формулалар жиынтығы
12.
Композиция дегеніміз не?
A)
Əртүрлі құрылымды АБҚ-ң бірнеше АБҚ-не сақтау операциясы
B)
Бірдей құрылымды АБҚ-ң бірнеше АБҚ-не өзгерту операциясы
C)
Əртүрлі құрылымды АБҚ-ң бір АБҚ-не түрлену операциясы
D)
Ұқсас АБҚ-ң бірнеше АБҚ-не түрлену операциясы
E)
Дұрыс жауабы жоқ
13.
Ақпараттық процессор дегеніміз:
A)
Есептеуге арналған бастапқы жəне анықтамалық ақпараттар
347
B)
Нəтежиеге жетпеу үшін ДБ жəне концептуалды схема
операцияларының командасын атқаратын механизм
C)
Нəтежиені алу үшін ДБ жəне концептуалды схема операцияларының
командасын атқаратын механизм
D)
ДБ мəліметтерді сақтайтын құрылғы
E)
Дұрыс жауабы жоқ
14.
Деректер базасын басқару жүйесі бұл -
A)
Бастапқы жəне анықтамалық ақпараттар
B)
Бағдарламаларды есте сақтау құрылғысы
C)
Мəліметтер жиынтығы
D)
ДБ енетін деректерді орталықтан сақтау, жинау, өзгерту жəне беруді
қамтамасыз ететін бағдарламалар кешені
E)
Аталғандардың барлығы жатады
15. Заттық облыс деп нені айтамыз?
A)
ЭАЖ-де сақталатын жəне өңделетін ақпараттарды, материалдық
жүйенің элементтерін атайды
B)
ЭАЖ-де сақталмайтын, бірақ өңделетін ақпараттарды, материалдық
жүйенің элементтерін атайды
C)
Мəліметтер базасының аймағындағы деректер жиынтығын айтады
D)
Кез келген облыстағы мəліметтер
E)
Дұрыс жауабы жоқ
16.
Ақпараттық база неден тұрады?
A)
Есептеуге арналған бастапқы жəне анықтамалық ақпараттардан
тұрады
B)
Материалдық құндылықтардан тұрады
C)
Бір немесе бірнеше бағдарламалардан тұрады
D)
Бір мəліметтен тұрады
E)
Бір немесе бірнеше деректер базасынан тұрады
17.
Транзакция бұл -
A)
Өзара байланыс
B)
ДБ жиынтығы
C)
Есте сақтау
D)
Кез келген өзгеріс
E)
Объектілерді өңдеу
348
18.
ДБ администраторы қандай қызмет атқарады?
A)
ДБ мəліметтерді жояды
B)
ДБ мəліметтерді сақтаушы
C)
ДБ қолданушыларына қызмет ететін маман не мамандар тобы
D)
Объектілерді іздестіретін бағдарлама
E)
Аталғандардың барлығы жатады
19.
Модульдердің түрлерін көрсет:
A)
Ақпараттық, реляциялық, желілік
B)
Реляциялық, желілік, қолданушылық
C)
Мəліметтік, иерархиялық, желілік
D)
Мəліметтік, желілік, қолданушылық
E)
Реляциялық, желілік, иерархиялық
20.
Ақпараттың негізгі екі түрі бар, біріншісі - ақпараттың құрама
бірлігі, ал екіншісіне не жатады?
A)
Ақпарат
B)
Атрибут
C)
Мəлімет
D)
Бағдарлама
E)
ДБ
349
14-ТАҚЫРЫП.
АҚПАРАТТЫ ШЫҒЫНДАП
ҚЫСУ ƏДІСТЕРІ
Дəрістің мəнмəтіні
Мақсаты: Ақпаратты қысу əдістерінің жалпы бағыттарын білу
Дəріс жоспары
1. Түрлендірулерді кодтау. JPEG қысу стандарты
2. Фракталды əдіс
3. Рекурсивті (толқынды) алгоритм
Негізгі түсініктер: абсолютті дəл, деректерді жуықтап қалпына
келтіру, кванттау, пиксель, квадраттық блоктар, дабыл спектрі,
арифметикалық кодтау, Хаффмен алгоритмі, спектрлік компонент-
тер, фракталды кодтау, wavelet
Тақырыптың мазмұны: Алғашқы деректерді тұтынушыға
берудің, абсолютті дəлдігіне деген қажеттіліктің, көбінесе керегі жоқ
болады. Біріншіден, деректер көздерінің өзі шектеулі динамикалық
диапозонға ие жəне бұрмалаулар мен қателердің белгілі бір
деңгейімен алғашқы хабарды шығарады. Екіншіден, байланыс ар-
налары бойынша деректерді беру мен оларды сақтау əрқашанда
əртүрлі кедергілердің болуы кезінде жүргізіледі. Сондықтан
(жаңғыртылған) хабар əрқашанда белгілі бір дəрежеде берілген
хабардан өзгешеленеді. Ең соңында, ақпараттарды алушылар –
адамның сезетін органдары, атқарушы тетіктер жəне т.б., сондай-
ақ соңғы шешуші қабілетке ие, яғни жаңғыртылатын хабардың
абсолютті дəл жəне жуық мəндері арасындағы шамалы айырма-
ларды байқамайды.
Бұзумен кодтау осы дəлелдерді деректерді жуықтап қалпына
келтіру пайдасы үшін ескереді жəне шамасы бойынша кейбір
бақыланатын қателер есебінен қысу коэффициенттерін алуға
мүмкіндік береді, бұл кейбір уақытта бұзбайтын əдістер үшін қысу
дəрежесінен ондаған есе артып кетеді.
Бұзатын қысу əдістерінің басым көпшілігі, деректердің өзін емес,
одан, мысалы, Фурье дискреттік түрлендіруінің коэффициенттерінен,
350
косинустық түрлендірудің коэффициенттерінен сияқты сызықтық
түрлендірулерді кодтауға негізделген.
JPEG – аса қуатты алгоритм. Тəжірибеде ол толық түрлі түсті
бейнелер үшін де-факто стандарты болып саналады. Анықтығы
мен түсі салыстырмалы түрде бірқалыпты өзгеретін алгоритм
8x8 аймақтарында сүйеніп пайдаланылады. Осының салдары-
нан, матрицалардың осындай аймағын косинустар бойынша екілік
қатарға жіктеу кезінде, алғашқы коэффициенттер ғана маңызды
болады. Сонымен JPEG-ке қысу, бейнелердегі түстерді өзгертудің
бірқалыптылығы есебінен жүзеге асырылады.
Алгоритм 24-биттік бейнелерді қысу үшін фотографиялар
саласындағы сарапшылар тобы арнайы əзірлеген болатын. JPEG
- Joint Photographic Expert Group – ISO – стандарттау жөніндегі
Халықаралық ұйым шеңберіндегі бөлімше. Тұтастай алғанда ал-
горитм – коэффициенттердің белгілі бір жаңа матрицаларын алу
үшін бейнелеу матрицасына қолданылатын дискреттік косинусой-
далды түрлендірулерге ДКТ (Discrete-Cosine Transform – DCT)-ке
негізделеді. Алғашқы бейнені алу үшін кері түрлендіру алынады.
DСТ бейнелерді кейбір жиіліктер амплитудалары бойынша өзара
бөледі. Сонымен, түрлендіру кезінде біз көптеген коэффициенттері
нөлге жақын, я тең болатын матрицаны аламыз. Бұдан өзге, адам
көзінің жетілмегендігінен коэффициенттерді бейнелеу сапасын
айтарлықтай жоғалтусыз неғұрлым өрескелдеу аппроксимациялауға
болады.
Бұл үшін коэффициенттерді кванттау (quantization) пайдаланы-
лады. Ең қарапайым жағдайда – бұл арифметикалық бит бойынша
оң жаққа ығысу. Мұндай түрлендірулерде ақпараттардың бір бөлігі
жоғалады, бірақ үлкен қысу дəрежесіне қол жеткізілуі мүмкін.
256 деңгейлердегі (8 екілік разрядтар) анықтық градацияларының
санымен өзінің санаулар (пиксельдер) жиынымен берілген ақ-
қара бейнені кодтау кезіндегі JPEG қысу алгоритмінің жұмысын
қарастырамыз. Бұл бейнелерді сақтаудың ең көп таралған тəсілі
– экрандағы əрбір нүктеге, оның айқындығын анықтайтын, бір
байт (8бит – 256 мүмкін мəндер) сəйкес келеді. 255 – ең жоғары
айқындық (ақ түс), 0 – ең төменгі айқындық (қара түс). Аралық мəн
сұр түстердің бүкіл қалған гаммасын құрайды (58-сурет).
JPEG қысу алгоритмінің жұмысы бейнені 8 х 8 = 64 пиксельдер
өлшемімен квадраттық блоктарға бөліктеу жолымен басталады.
351
Қысудың екінші кезеңі – бүкіл блоктарға дискреттік косинустық
түрлендіруді – DСТ қолдану. Дискреттік косинустық түрлендіру
бейнені кеңістіктік көрсетуден (санаулар немесе пиксельдер жиы-
нымен) спектрлік көрсетуге (жиілікті құраушылардың жиынымен)
көшуге жəне керісінше жасауға мүмкіндік береді.
IMG ( x, y ) бейнелеуден дискреттік косинустық түрлендіру мына-
дай түрде жазылуы мүмкін:
DCT (u,v) = sqrt(2/N) ∑
i,j
IMG (x
i
, y
j
)cos ((2i +1)π u/2N)cos ((2j +1)
π v/2N), (183)
мұндағы, N = 8, 0 < i < 7 , 0 < j < 7,
немесе, матрицалық формада
RES = DCT
T
*IMG * DCT
(184)
мұндағы, DСТ – төмендегідей түрге ие, өлшемі 8 х 8 түрлендіру
үшін базистік (косинустық) коэффициенттер матрицасы:
Сонымен, блокқа дискреттік косинустық түрлендірудің өлшемі
8 х 8 пиксельдері бейнесін қолдану нəтижесінде, сондай-ақ
санаулардың 8 х 8 өлшеміне ие екі өлшемді спектр аламыз. Басқаша
айтсақ, бейненің санауларын көрсететін 64 саны, оның DСТ-
спектрінің санауларын көрсететін 64 санға айналады.
.35355
3
.35355
3
.35355
3
.35355
3
.35355
3
.35355
3
.35355
3
.35355
3
.49039
3
.41581
8
.27799
2
.09788
7
-
.09710
6
-
.27732
9
-
.41537
5
-
.49024
6
.46197
8
.19161
8
-
.19088
2
-
.46167
3
-
.46228
2
-
.19235
3
.19014
5
.46136
6
DC
T =
.41481
8
-
.09710
6
-
.49024
6
-
.27865
3
.27666
7
.49071
0
.09944
8
-
.41448
6
(185
)
.35369
4
-
.35313
1
-
.35425
6
.35256
7
.35481
9
-
.35200
1
-
.35537
8
.35143
5
.27799
2
-
.49024
6
.09632
4
.41670
0
-
.41448
6
-
.10022
8
.49101
3
-
.27467
3
.19161
8
-
.46228
2
.46136
6
-
.18940
9
-
.19382
2
.46318
7
-
.46044
0
.18719
5
.09788
7
-
.27865
.41670
0
-
.49086
.48977
1
-
.41359
.27400
8
-
.09241
3 2 3 4
352
Дабыл спектрі – бұл тиісті спектрлік құраушылар, нəтижесінде
осы дабылды беретін жиынға кіретін коэффициенттер шамалары. Да-
был соған өзара бөлінетін, жекелеген спектрлік құраушылар, көбінесе
базистік атқарымдар деп аталады. ПФ үшін əртүрлі жиіліктердегі сину-
стар мен косинустар базистік атқарымдар деп аталады.
8 х 8 DСТ үшін базистік атқарымдар жүйесі мына формуламен
беріледі
16
)
1
y
2
(
cos
16
u
)
1
x
2
(
cos
]
y
,
x
[
b
(186)
ал базистік атқарымдардың өзі 59-суретте көрсетілген сияқты
көрінеді. (0,0) индекстерге сəйкес келетін, аса төмен жиілікті
базистік атқарым суреттің сол жақ жоғарғы бұрышында, ал аса
жоғары жиілік – төменгі оң жақта бейнеленген. (0,1) үшін базистік
атқарым, бір координат бойынша косинусоид периодының жарты-
сын жəне (1,0) индекстермен өзге базистік атқарым бойынша кон-
8
8
231224224 217 217 203 189196
210217203 189 203 224 217224
196217210 224 203 203 196189
210203196 203 182 203 182189
203224203 217 196 175 154140
182189168 161 154 126 119112
175154126 105 140 105 119 84
154 98 105 98 105 63 112 84
42 28 35 28 42 49 35 42
49 49 35 28 35 35 35 42
42 21 21 28 42 35 42 28
21 35 35 42 42 28 28 14
56 70 77 84 91 28 28 21
70 126133147161 91 35 14
126203189182175175 35 21
49 189245210182 84 21 35
154 154 175 182 189 168 217 175
154 147 168 154 168 168 196 175
175 154 203 175 189 182 196 182
175 168 168 168 140 175 168 203
168 168 154 196 175 189 203 154
168 161 161 168 154 154 189 189
147 161 175 182 189 175 217 175
175 175 203 175 189 175 175 182
58-сурет. Сұр түстер гаммаларының аралық мəндері
353
стантаны көрсетеді, бірақ 90º-қа бұрылған.
Дискреттік косинустық түрлендіру 8 х 8 пиксельдер бейнесінің
блоктарын осы базистік атқарымдардың əрбірімен элемент бойын-
ша қайта көбейту жəне қосындылау жолымен есептеледі.
Нəтижесінде, мысал үшін, DСТ – спектрінің компоненті (0,0)
индекстермен, бейне блогының бүкіл элементтерінің жиынын
жай түрде көрсететін болады, яғни блок үшін орташа анықтықты
көрсетеді. (0,1) индекспен компонентке бейненің бүкіл горизон-
таль бөлшектері бірдей салмақтармен орташаландырылады, ал вер-
тикаль бойынша ең үлкен салмақ бейненің жоғарғы бөліктерінің
элементтеріне беріледі. DСТ матрицасында оның компоненті
неғұрлым төмен жəне оң жаққа қарай болса, ол соғұрлым бейненің
неғұрлым жоғары жиіліктік бөлшектеріне сəйкес келеді.
DCT-спектрі бойынша алғашқы бейнені алу үшін (кері
түрлендіруді орындау үшін), енді (0,0) индекстері бар базистік
атқарымды (0,0) координаталарымен спектрлік компонент-
ке көбейту, көбейтінді нəтижесіне, спектрлік (1,0) базистік
атқарымдар көбейтіндісінің нəтижесіне компонентке (1,0) базистік
атқарымдарды (1,0) қосу қажет.
Төменде келтірілген 10-кестеден бейне блоктарының жəне оның
DCT-спектрінің бірінің сандық мəндерін көруге болады:
10-кесте. Бейненің жəне оның DСТ-спектрінің сандық мəні
Алғашқы деректер
139
144
149
153
155
155
155
155
144
151
153
156
159
156
156
156
150
155
160
163
158
156
156
156
159
161
161
160
160
159
159
159
159
160
161
162
162
155
155
155
161
161
161
161
160
157
157
157
161
162
161
163
162
157
157
157
162
162
161
161
163
158
158
15
DCT нəтижесі
235,6
-1
-12,1
-5,2
2,1
-1,7
-2,7
1,3
-22,6
-17,5
-6,2
-3,2
-2,9
-0,1
0,4
-1,2
-10,9
-9,3
-1,6
1,5
0,2
-0,9
-0,6
-0,1
354
Алғашқы деректер
-7,1
-1,9
0,2
1,5
0,9
-0,1
0
0,3
-0,6
-0,8
1,5
1,6
-0,1
-0,7
0,6
1,3
1,8
-0,2
1,6
-0,3
-0,8
1,5
1
-1
-1,3
-0,4
-0,3
-1,5
-0,5
1,7
1,1
-0,8
-2,6
1,6
-3,8
-1,8
1,9
1,2
-0,6
-0,4
Алынған DCT-спектрдің өте қызықты ерекшелігін атап өтеміз:
оның ең үлкен мəні сол жақ жоғарғы бұрышына шоғырландырылған
(төменжиілікті құраушылар), оның оң жақтағы төменгі бөлігі
(жоғары жиілікті құраушылар) салыстырмалы түрде шағын сан-
дармен толтырылған. Бұл сандар, бейне блогындағыдай болады:
8х8 = 64, яғни əзірге ешқандай қысу болмағандай жəне егер кері
түрлендіруді орындайтын болсақ, бейненің сондай блогын алатын
боламыз.
JPEG алгоритм жұмысының келесі кезеңі кванттау (11-кесте) бо-
лып саналады.
Егер DCT нəтижесінде алынған коэффициенттерге назар салып
DCT-
Достарыңызбен бөлісу: |