Әдебиеттер тізімі
1. Загоруйко Н. Г. Методы распознавания образов и их применение. – М.: Советское радио, 1972. – 288 с.
2. Журавлев Ю.И. Непараметрические задачи распознавания образов
Кибернетика. – 1976. – № 6. – С. 93-103.
3. Журавлев Ю.И., Камилов М.М., Туляганов Ш.Е. Алгоритмы вычисления оценок и их применение. – Ташкент:
ФАН, 1994. – 155 с.
4. Зуев Ю.А. Вероятностные методы в пороговой логике: автореф. ... докт. физ.-мат. наук. – М.: МГУ, 1998.
5. Амиргалиев Е.Н. Модели и методы комитетного синтеза и оптимизации в задачах классификации и
распознавания образов. – Алматы, 2002. – 123 с.
ӘОЖ 519.7, 519.97
БЕЙНЕ ТАНУ ЕСЕПТЕРІНДЕ АЛГЕБРАЛЫҚ ЖӘНЕ ТОПТЫҚ МОДЕЛЬДЕРДІ ҚОЛДАНУ
Калимова Ж., Коданова Ш.К., Майлыбаева А.Ж., Оразбаев Б.Б.
Х. Досмұхамедов атындағы Атырау мемлекеттік университеті, Атырау қ.
kodanova_sh@mail.ru
,
batyr_o@mail.ru
Қазіргі уақытта қоғамның, өнідістің дамуы көптеген мәселелер бойынша ақпараттық технологиялар мен
математикалық тәсілдердің дамуымен анықталады. Ақпараттық технологиялардың әртүрлі пән аймағындағы,
соның ішінде нашар қалыптасқан қолданбалы есептерді шешудегі жетістіктері көбінесе бейне тану және
классификациялау мәселелерінің шешілуімен тығыз байланысты.
Бейне тану және классификациялау мәселелері мен оларды шешу тәсілдерінің тез дамуы олардың
пәнаралық сипатымен анықталады. Классификациялау мен бейне танудың математикалық әдістерінің дамуына
нақты пән аймағындағы қолданбалы есептерді шешу қажеттілігі, олардың нашар формализациялануы себеп
болып табылады [
1, 2
].
Нашар формализацияланған есептер геологияда, ауыл шаруашылығында, экология, медицина, мұнай-газ
тағы басқа өндірістер салаларында жиі туындайды. Алғашқы ақпараттардың толық анықталмағандығы,
айқынсыздығы қатаң математикалық теорияға негізделген әдістерді бұл жағдайда қолдану мүмкінсіздігі, есеп
шығару процесіне адамның немесе басқа жүйелердің араласу мүмкіндігі бейне тану және классификациялаудың
математикалық әдістерінің дамуына себеп болды.
Бүгінгі таңда бейне тану және классификациялау жүйелері қолданылмайтын немесе жақында қолданыста
болмайтын өндіріс және ғылым саласын айту қиын. Осыдан техника және ғылым саласында тану әдістерінің
қолданылуы бұл бағыттарға өз әсерін тигізеді, шындығында бұл проблемаларды жаңа әсерлермен жабдықтап, әрі
қарай дамуына себеп болды.
Бейне танудағы алгебралық тәсіл дискретті математиканың, алгебраның және математикалық логиканың
аппараты мен әдісін қолдануға негізделген [
3
]. Бұл бағыттың дамуына Ю.И. Журавлевтің еңбектері мен оның
тұйыққа тірелген тестілерді іздеу алгоритмін және солардың негізінде объектілердің кластарға қатыстылық
дәрежесін бағалауды есептеу алгоритмін (БЕА) ұсынған ғылыми мектебі негіз болды [4]. Аталған алгоритмдер
теориялық тұрғыдан кез келген басқа да алгоритмдерді жүзеге асыруға, белгілер арасында күрделі тәуелділікті
сипаттайтын есептерді шешуге мүмкіндік береді.
Эвристикалық классификацияланған алгоритмдердің жиынтық шамасында олардың біркелкі суреттеуі мен
теориялық жинақтауын құру қажеттілігі туындады. Таксономиялық рәсімді жете талдау олардың қалыптасуының
жалпы процесін суреттеуге мүмкіндік ашты. Алгоритмдер жиынында қазір қолданылып жүрген бұл процесстер
біршама формализацияға байланысты математикалық суреттеу түрінде жүзеге аса алады. Соның негізінде Ю.И.
Журавлев бейне тану және классификация алгоритмдерінің жалпы теориясын құруды міндет етіп, алгоритмдердің
қарастырып жатқан класын тиімді зерттеу мен сипаттау жүргізуге мүмкіндік беретін «бейне тану және
классификация міндеттерін шешудегі алгебралық тәсілді» ұсынды [
5
].
Көппараметрлі модельге қолайлы алгоритм құру экстремальді қиын есептерді шешумен байланысты.
Ұсынылған алгебралық тәсіл арнайы алгебралық операциялардың көмегімен классификацияланатын және бейне
тану алгоритмдердің шоғырын кеңейту үшін мүмкіндік беріп, тағайындалған белгілері бар нақты алгоритмдерді
алуына кепіл болатын алгоритмдер тобын құруға мүмкіндік береді. Аталған жағдайда алгоритмдер жиыны алгебра
болып табылады. Тіпті бұл алгебраның операцияларында алгоритмдердің қарастырып жатқан класына берілген
әртүрлі сипаттамасын жете қарастыруға мүмкіндік беретін қасиет бар. Бастапқы ақпаратты дұрыс
классификациялайтын алгоритмдер класын суреттеу үшін кез келген толық модельді алып, оның бейнетанушы
операторлар жиынтығының тізбекті тұйықталуын қарастырып, оған дұрыс шешілетін ережені қосу жеткілікті.
309
Бейне тану алгоритмдер моделін зерттеу әрқилы қолданбалы есептерді шешуге және маңызды
теориялық нәтижелер алуға мүмкіндік береді. Сонымен бірге бейне тану есептерін шешудің аталған әдістеріне
жекелеген модельдерді ғана қарастырғанда болдырмауға болмайтын кейбір маңызды кемшіліктер тән. Бұл
қиындықтарды жеңу үшін бейне тану алгоритмдер класын құрылымды сипаттау мен тиімді зерттеуді қамтамасыз
ететін алгоритмдердің барлық модельдері қамтылатын, бейне тану алгоритмін осылай анықтауды енгізуді
ескеретін, бейне тану мен классификациялау есептерін шешуге алгебралық амал негізінде құрылған бейне тану
алгоритмдерінің жалпы теориясы ұсынылған.
Алгебралық амал алгебралық операциялар көмегімен алгоритмдердің түпкі эвристикалық негізін байыту
және түзеткіш алгоритмін алуды, есептердің зерттелетін класын шешуді қамтамасыз ететін тобын құруды
қамтиды. Базалық алгоритмдер мен бейне тану модельдері ерекшеленеді және жаңа алгоритмдер мен
модельдерді тізбектей жасақтауға мүмкіндік беретін операциялар енгізіледі. Аталған амалдың мәні мынада:
барлық кластар бойынша соңғы таңдауды дұрыс классификациялайтын түзеткіш алгоритм құрамында болатын
алгоритмдердің тобы негізінде кеңейтуге мүмкіндік беретін операциялар қандай да бір алгебра ретінде осындай
алгоритмдердің тобы қарастырылады.
Алгебралық амалдармен бейне танудың кез келген рәсіміне сәйкес құрылыс ерекшеліктері біршама толығады. Ол
бастапқы сипаттама мен болжанатын жауаптардың аралық бағалау кеңістігі деп аталатын мәліметті алдын ала
ескереді. Мұнда бейне тану алгоритмі екі оператордың ұстанымы ретінде қарастырылады: олардың біріншісі –
бейне танушы – жауап ретінде бағалау деп аталатын элементтерді қалыптастырады, ал екіншісі (шешуші ереже) –
бағалау бойынша толық жауапты анықтайды. Сонымен, бастапқы сипаттамалар мен болжанатын жауаптардың
«ыңғайсыз» кеңістігімен жұмыс істеу қажеттілігіне қарағанда бағалау кеңістігінде түзету енгізу мүмкіндігі басым
түседі.
Сонымен, түрлі нашар формализацияланған салаларда формальді модельдерін құрғанша эвристикалық
алгоритмдер тобын құру, сосын алгебраны көптеген осындай есептерге енгізу және оның алгебралық
тұйықталуын құру жеткілікті. Бұл алгоритмдер көмегімен нашар формализацияланған салалардың кез келген
есебі тиімді шешімін табады.
Топтық шешімдерге негізделген бейне тану мен классификация есептерінің модельдері бейне тану мен
классификация алгоритмдерінің сенімділігін арттыру үшін бір емес, бірнеше шешуші ереже функцияларын
қолдануға болады деген пікірге негізделген. Бірнеше базалық шешуші функциялардан тұратын жиынтықты
топтық шешуші функцияны табу үшін қолдануға болады. Мұнда топтық шешуші функцияны құрастыру кезінде
қолданылатын әдістердің әрқайсысының жетістіктерін ескереді. Сонымен қатар әрбір базалық шешуші функция
үшін оның ең үздік «білгір» саласы анықталуы мүмкін. Мұнда олардың «білгір» салаларын анықтауға негізделген
шешуші ережелер тобын жинақтаудың өзіндік әдісі болжанатын А.А. Растригин, Р.Х. Эренштейн еңбектерін атауға
болады.
Бейне танудың ұқсас әдістеріне қарағанда кластерлеу алгоритмдерін топтық жинақтау саласындағы
зерттеулер кең дамымаған. Ю.А. Зуев жұмысында классификациялау сенімділігін арттыру мақсатында
монотондылық принципіне негізделген түзеткіш орнату қарастырылады [
6
]. Қазақстандық ғалымдар
М.Б.Айдарханов, А.Ф.Мұхамедғалиев, Е.Н.Әмірғалиевтардың жұмысында классификация алгоритмдері тобының
топтық шешімдерін жинақтаудың түрлі әдістері зерттелген [
7, 8
].
Топтық жинақтау есептерін шешудің жалпы орындалуы екі принципті бағытта қарастыруды қажет етеді.
Бірінші бағыт топ алгоритмдері жұмыс нәтижелерінің бастапқы ұғымдарын қалыпқа түсіруден тұрса, екінші бағыт
түпкі қорытынды бөлудің қалыпқа түскен ұғымды қалыптастырудан тұрады.
Егер топтық жинақтау есептерінің бірінші бөлігін жүзеге асыру айтарлықтай қиындықтар туғызбаса, онда
оның екінші бөлігі көп нұсқалы, күрделі болып табылады және арнайы қарастыруды талап етеді. Топтық жинақтау
есептерін шешудің екі негізгі амалы бар. Бірінші амал бейне тану есептерін артынан шешумен топ алгоритмдерін
көптеген бөлшектеуде ықшам көптүрлілікті (ядроларды) құрудан тұрады. Екінші амал эквиваленттілік қатынасын
қанағаттандыратын түрге дейін алгоритмдер жұмысы нәтижелерін қалыпқа түсірілген бірлестікке анықталған
кейбір бинарлық қатынасты түзетуден тұрады. Бірінші амал – тура таксономия, екінші амал – құрылымдық
түзеткіш деп аталады.
Бейне танудың жаңылыс (түзетілмеген) алгоритмдер жиынтығын талдау олардың толығуына қарай кейбір
жеке алгоритмдерді ғана емес, оларды қалыптастыру принциптерін де ерекшелеуге және сипаттауға мүмкіндік
береді. Көптеген алгоритмдерге әсер ететін және алдымен нашар формализацияланған бұл принциптер сосын
дәл математикалық сипаттама түрінде жүзеге асуы мүмкін. Осы кезеңде эвристикалық сипат принцип таңдауға
ие, ал ұқсас принцип негізінде туындаған алгоритмдер стандартты түрде құрылуы мүмкін. Атап айтқанда, осы
мағынада бейне танушы алгоритмдерді құрастырудың түрлі принциптерін қалыпқа түсіру бейне танушы
алгоритмдер модельдерінің пайда болуына әкеледі.
Бейне тану алгоритмдерінің қатарын параметрлеу және кластар туралы ақпараттар негізінде параметрлер
мәнін анықтау мүмкіндігі есептердің кейбір кластарына арналған түзеткіш алгоритмдер таңдауға мүмкіндік береді.
Бейне тану дамуының кезекті кезеңі жаңылыс (түзетілмейтін) алгоритм жиынтығын құрумен байланысты болды.
Модельді байыту, көбінесе нәтижелерді эквивалентті жақсартумен қатар жүрмейтіндіктен, сондай-ақ кез келген
модель күрделілігінің шынайы шегі болатындықтан, алгоритмнен тыс (түзеткіш операциялар) операцияларға
сәйкес пайдалана отырып, қолданыстағы алгоритмдерден тікелей тиімді алгоритм құру туралы пікір туындады.
Сонымен, бейне танудың қатаң теориясын құрудың қажетті шарты «бейне тану алгоритмі» түсінігіне
арналған классикалық алгоритм зерттеулерін жүргізу болып табылады. Тиісінше анықтауыш басқа да шарттарға
310
жауап беруі керек, соның ең бастысы бейне тану алгоритмін зерттеудің соңғы кезеңдерінде осы анықтауышпен
жұмыс істеуді талап етеді.
Әдебиеттер тізімі
1. Ту Дж., Гонсалес Р. Принципы распознавания образов. – М.: Мир, 1978. – 416 с.
2. Мандель В.Л. Кластерный анализ. – М.: Финансы и статистика, 1988. – 176 . с.
3. Загоруйко Н. Г. Методы распознавания образов и их применение. – М.: Советское радио, 1972. – 288 с.
4. Журавлев Ю.И. Непараметрические задачи распознавания образов
Кибернетика. – 1976. – № 6. – С. 93-103.
5. Журавлев Ю.И., Камилов М.М., Туляганов Ш.Е. Алгоритмы вычисления оценок и их применение. – Ташкент:
ФАН, 1994. – 155 с.
6. Зуев Ю.А. Вероятностные методы в пороговой логике: автореф. ... докт. физ.-мат. наук. – М.: МГУ, 1998.
7. Айдарханов М.Б., Амиргалиев E.Н., Мухамедгалиев А.Ф. Алгоритмические основы построения систем
классификации / Научное издание. – Алматы: Институт проблем информатики и управления МОН РК, 1999. –
100с.
8. Амиргалиев Е.Н. Модели и методы комитетного синтеза и оптимизации в задачах классификации и
распознавания образов. – Алматы, 2002. – 123 с.
ЭЛЕКТРОННЫЙ ДОКУМЕНТООБОРОТ
Дуков А.В.
Генеральный директор компании «АрмаДок», г. Москва
a.dukov@armadoc.ru
Аннотация
Юридически значимый электронный документооборот (ЭДО) постепенно превращается из дискуссионной
темы в реальность. Цель статьи — дать представление о теоретических основах ЭДО и электронно-цифровой
подписи (ЭЦП) и привести примеры практического использования электронных документов в нынешних условиях.
Понятие ЭЦП
Известно, что содержимое любого документа (файла) представлено в компьютере как последовательность
байтов и потому может быть однозначно описано определенным (очень длинным) числом или
последовательностью нескольких более коротких чисел. Чтобы «укоротить» эту последовательность, не потеряв
ее уникальности, применяют специальные математические алгоритмы, такие как контрольная сумма (controltotal)
или хеш-функция (hashfunction). Если каждый байт файла умножить на его номер (позицию) в файле и
полученные результаты суммировать, то получится более короткое, по сравнению с длиной файла, число.
Изменение любого байта в исходном файле меняет итоговое число. На практике используются более сложные
алгоритмы, исключающие возможность введения такой комбинации искажений, при которой итоговое число
осталось бы неизменным. Хеш-функция определяется как уникальное число, полученное из исходного файла
путем его «обсчета» с помощью сложного, но известного (открытого) алгоритма. Один из этих алгоритмов
закреплен в ГОСТе Р 34.11-94 «Информационная технология. Криптографическая защита информации. Функция
хеширования».[
1
].
Теперь рассмотрим, как получается электронная подпись. Здесь требуется небольшое отступление. С
древних времен известен криптографический метод, позднее названный шифрованием с помощью
симметричного ключа, при использовании которого для зашифровки и расшифровки служит один и тот же ключ
(шифр, способ). Главной проблемой симметричного шифрования является конфиденциальность передачи ключа
от отправителя к получателю. Раскрытие ключа в процессе передачи равносильно раскрытию документа и
предоставлению злоумышленнику возможности его подделать.
В 70-х гг. был изобретен алгоритм асимметричного шифрования. Суть его состоит в том, что
зашифровывается документ одним ключом, а расшифровывается другим, причем по первому из них практически
невозможно вычислить второй, и наоборот. Поэтому если отправитель зашифрует документ секретным ключом, а
публичный, или открытый, ключ предоставит адресатам, то они смогут расшифровать документ, зашифрованный
отправителем, и только им. Никто другой, не обладая секретным ключом отправителя, не сможет так
зашифровать документ, чтобы он расшифровывался парным к секретному открытым ключом.
Отправитель, вычислив хеш-функцию документа, зашифровывает ее значение своим секретным ключом и
передает результат вместе с текстом документа. Получатель по тому же алгоритму вычисляет хеш-функцию
документа, потом с помощью предоставленного ему отправителем открытого ключа расшифровывает переданное
значение хеш-функции и сравнивает вычисленное и расшифрованное значения. Если получатель смог
расшифровать значение хеш-функции, используя открытый ключ отправителя, то зашифровал это значение
именно отправитель. Чужой или искаженный ключ ничего не расшифрует. Если вычисленное и расшифрованное
значения хеш-функции совпадают, то документ не был изменен. Любое искажение (умышленное или
неумышленное) документа в процессе передачи даст новое значение вычисляемой получателем хеш-функции, и
программа проверки подписи сообщит, что подпись под документом неверна.[
2
]
311
Таким образом, в отличие от собственноручной подписи, ЭЦП неразрывно связана не с определенным
лицом, а с документом и секретным ключом. Если дискетой с вашим секретным ключом завладеет кто-то другой,
то он, естественно, сможет ставить подписи за вас. Однако вашу ЭЦП нельзя перенести с одного документа на
какой-либо другой, ее невозможно скопировать, подделать — под каждым документом она уникальна. Процедуры
хранения, использования, обновления и уничтожения ключей достаточно подробно расписаны в различных
методических рекомендациях к системам ЭЦП.
Шифрование
Рассмотрим шифрование информации асимметричными ключами. Если поменять ключи местами, иными
словами, секретным сделать ключ расшифровывания, а открытым (публичным) — ключ зашифровывания, то
отправитель может зашифровать письмо открытым ключом получателя, и тогда прочитать письмо сумеет лишь
тот, у кого имеется парный секретный ключ, т. е. только сам получатель. Великое преимущество асимметричной
схемы шифрования в том и заключается, что отпадает необходимость в конфиденциальной передаче ключей.
Открытый ключ можно сделать доступным на Web-сайте, передать по электронной почте и т. п., не опасаясь
негативных последствий доступа к нему третьих лиц.[
3
]
Для удобства шифрования и использования ЭЦП в корпоративных системах с большим числом абонентов
применяются справочники открытых ключей. Каждый ключ имеет тело и номер, одинаковый для секретной и
открытой частей ключа и уникальный для каждого абонента. Номер передается в открытом виде в заголовке
зашифрованного документа или в заголовке ЭЦП. Получатель по этому номеру из соответствующего справочника
выбирает сам ключ, который подставляется в процедуру расшифровывания или проверки подписи. Выполняется
такая выборка, как правило, с помощью специальных программ, и вся процедура занимает доли секунды.[4].
Управление ключевой системой
Важную роль в системе электронного документооборота играет администрация системы. Она обеспечивает
контроль за соблюдением абонентами единых правил работы, участвует в разборе конфликтных ситуаций,
управляет ключевой системой и, что очень важно, поддерживает у всех абонентов справочники открытых ключей
в актуальном состоянии. Справочники меняются регулярно: при любом изменении списка участников, при замене
каких-либо ключей. Необходимость замены ключей возникает, скажем, в случае их компрометации — под этим
понимают ряд событий, при которых ключевая информация становится недоступной или возникает подозрение о
несанкционированном доступе. К таким событиям относятся утрата ключевых дискет; утрата дискет с
последующим обнаружением; повреждение дискет; увольнение сотрудника, имевшего доступ к ключевой
информации; нарушение правил хранения и уничтожения (после окончания срока действия) секретных ключей и
др.
При возникновении подобного события участник системы обязан незамедлительно уведомить
администрацию системы (или ее подразделение — центр управления ключевой системой) о факте
компрометации. В свою очередь, администрация должна блокировать открытый ключ участника в справочнике и
оповестить об этом других участников (обновить у них справочники). Фиксация момента уведомления
администрации о компрометации ключей очень важна. Действительными считаются только те документы
участника, которые были получены до этого момента. Данный факт учитывается при разборе конфликтных
ситуаций: прежде всего проводится проверка, являлся ли ключ отправителя действующим на момент получения
документа адресатом.
В том случае, когда в корпоративной системе документооборота предусмотрен обмен электронными
документами лишь между центром (банком, брокерской фирмой, холдингом) и его клиентами, клиентам
достаточно знать только один открытый ключ ЭЦП этого центра, последний же использует справочник открытых
ключей всех клиентов. Если же в системе предусмотрена возможность обмена электронными документами между
абонентами напрямую, то справочники с перечнями открытых ключей должны быть у всех участников и
обновляться одновременно.
Пакет документов
Организация системы электронного документооборота не сводится к установке программного обеспечения.
Значительно более сложным и трудоемким процессом (по крайней мере, на начальном этапе) является
подготовка документов, подробно описывающих все процедуры функционирования системы, а также обучение
сотрудников, которые будут обеспечивать ее работу. Упрощает ситуацию то, что образцы подобных документов
уже существуют и можно заказать разработку всего пакета компании, имеющей опыт успешного применения
ЭДО. Идеально, если эти документы прошли «проверку боем», то есть на их основе рассматривался конфликт в
суде. Администрацию системы можно организовать на базе сторонней фирмы, располагающей соответствующими
службами, квалифицированными сотрудниками, необходимыми комплектами договоров, определенным опытом
обслуживания таких систем. Риск раскрытия конфиденциальной информации при этом отсутствует, поскольку
секретными ключами участников администрация не обладает — она оперирует только справочниками открытых
ключей. Важно, чтобы генерация ключей (включая секретные) проводилась уполномоченными сотрудниками
участников (пусть и на территории лицензированной администрации, что будет описано ниже).
Необходимым элементом пакета документов по ЭДО является описание процедуры разбора конфликтной
ситуации, когда одной из сторон необходимо доказать наличие и действительность ЭЦП другой стороны под
электронным документом. Прежде всего необходимо перечислить условия проверки ЭЦП: где проводится
проверка, на каком аппаратном и программном обеспечении, кем, в какие сроки и т. д., а также какое решение
принимается, если по каким-либо причинам эти условия не удается соблюсти. Сама процедура проверки должна
быть описана по шагам и исключать двойное толкование результатов; необходимо указать два типа действий —
312
при положительном и отрицательном исходе выполнения каждого шага. Таким образом, у комиссии,
занимающейся проверкой, после завершения процедуры должно сформироваться единое мнение, а затем
конфликтующие стороны могут либо заключить мировое соглашение, либо обратиться в суд.
Достарыңызбен бөлісу: |