Рисунок 1. Кривые хи-квадрат распределений для трех и четырех степеней свободы при разных значениях
коррелированности биометрических данных
Из рисунка 3 видно, что хи-квадрат распределения зависимых данных имеют математические
ожидания, точно совпадающее с числом его степеней свободы:
m
))
r
,
m
(
(
E
2
. (4)
Свойство (4) распределения
)
r
,
m
(
2
сохраняется для любых значений коэффициентов
равной коррелированности. Во всем остальном поведение плотностей зависимых распределений
))
0
r
,
m
(
(
p
2
и независимых плотностей
))
0
r
,
m
(
(
p
2
сильно отличаются. По мере увеличения
коррелированности данных фактически происходит частичная утрата числа степеней свободы.
Тем не менее, зная число степеней свободы (число столбцов у классической или
«сглаженной» гистограммы) и, соответствующий ей коэффициент равной коррелированности
данных, мы всегда можем скорректировать критерий хи-квадрат проверки статистических гипотез.
Тем самым мы можем существенно увеличить достоверность оценок проверки статистических
гипотез.
ЛИТЕРАТУРА
1. Кобзарь А.И. Прикладная математическая статистика для инженеров и научных работников. М.
ФИЗМАТЛИТ, 2006 г., 816 с.
2. Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in χ
2
test for goodness of fit. // The
Annals of Mathematical Statistics. – 1954. – Vol. 25. – P. 579–586.
3. Волчихин В.И., Иванов А.И., Фунтиков В.А., Назаров И.Г., Язов Ю.К. Нейросетевая защита
персональных биометрических данных. // М.: Радиотехника, 2012., 157 с., ISBN 978-5-88070-044-8.
371
4. B. Akhmetov, A. Doszhanova, A. Ivanov, T. Kartbaev and A. Malygin “Biometric Technology in Securing
the Internet Using Large Neural Network Technology. World Academy of Science, Engineering and Technology. Issue
79, July, 2013, Singapore, p. 129-138, pISSN 2010-376X, eISSN 2010-3778, www.waset.org.
5. Иванов А.И., Кисляев С.Е., Гелашвили П.А. Искусственные нейронные сети в биометрии, медицине,
здравоохранении. Самара: ООО «Офорт», 2004, 236 с.
6. ГОСТ Р 52633.5-2011
«Защита
информации.
Техника
защиты
информации.
Автоматическоеобучениенейросетевыхпреобразователейбиометрия-коддоступа».
7. Ахметов Б.С., Иванов А.И., Урнев И.В., Сериков И.В., Газин А.И. Оценка значений числа степеней
свободы статистик описания выходного кода преобразователя биометрия-код при использовании
распределения 2, Алматы: Изд-во КазНТУ имени К.И. Сатпаева, http://portal.kazntu.kz/files/publicate/2013-04-
05-elbib.pdf
8. B. Akhmetov, A. Ivanov, V. Funtikov, I. Urnev Evaluation of Multidimensional Entropy on Short Strings of
Biometric Codes with Dependent Bits. «Progress in Electromagnetics Research Symposium» PIERS Proceedings,
August 19-23, Moscow, RUSSIA 2012, p.66-69.
9. Ахметов Б.С., Надеев Д.Н., Урнев И.В. Сериков И.В. Аппроксимация биномиального зависимого
закона композициями нормального, равномерного, арксинусного распределения значений М.: Радиотехника,
«Нейрокомпьютеры: разработка, применение», №3, 2012. С. 17-20.
10. Фунтикова Ю.В., Иванов А.И., Захаров О.С. Гипотеза 2 распределения расстояний Хэмминга для
кодов биометрической аутентификации примеров образа «Свой». Труды научно-технической конференции
кластера
пензенских
предприятий,
обеспечивающих
БЕЗОПАСНОСТЬ
ИНФОРМАЦИОННЫХ
ТЕХНОЛОГИЙ. Пенза: Изд-во Пензенского гос. ун-та, 2014. Том 9, , с. 7-8., http://www.pniei.penza.ru/RV-
conf/T9/С7.
REFERENCES
1.
Kobzar' А.I. Prikladnaya matematicheskaya statistika dlya inzhenerov i nauchnykh rabotnikov. M.
FIZMАTLIT, 2006 g., 816 s.
2.
Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in χ
2
test for goodness of fit. //
The Annals of Mathematical Statistics. – 1954. – Vol. 25. – P. 579–586.
3. Volchikhin V.I., Ivanov А.I., Funtikov V.А., Nazarov I.G., YAzov YU.K. Nejrosetevaya zashhita
personal'nykh biometricheskikh dannykh. // M.: Radiotekhnika, 2012., 157 s., ISBN 978-5-88070-044-8.
4. B. Akhmetov, A. Doszhanova, A. Ivanov, T. Kartbaev and A. Malygin “Biometric Technology in Securing
the Internet Using Large Neural Network Technology. World Academy of Science, Engineering and Technology. Issue
79, July, 2013, Singapore, p. 129-138, pISSN 2010-376X, eISSN 2010-3778, www.waset.org.
5. Ivanov А.I., Kislyaev S.E., Gelashvili P.А. Iskusstvennye nejronnye seti v biometrii, meditsine,
zdravookhranenii. Samara: OOO «Ofort», 2004, 236 s.
6.
GOST
R
52633.5-2011
«Zashhita
informatsii.
Tekhnika
zashhity
informatsii.
Аvtomaticheskoeobuchenienejrosetevykhpreobrazovatelejbiometriya-koddostupa».
7. Аkhmetov B.S., Ivanov А.I., Urnev I.V., Serikov I.V., Gazin А.I. Otsenka znachenij chisla stepenej svobody statistik
opisaniya vykhodnogo koda preobrazovatelya biometriya-kod pri ispol'zovanii raspredeleniya 2, Аlmaty: Izd-vo
KazNTU imeni K.I. Satpaeva, http://portal.kazntu.kz/files/publicate/2013-04-05-elbib.pdf
8. B. Akhmetov, A. Ivanov, V. Funtikov, I. Urnev Evaluation of Multidimensional Entropy on Short Strings of
Biometric Codes with Dependent Bits. «Progress in Electromagnetics Research Symposium» PIERS Proceedings,
August 19-23, Moscow, RUSSIA 2012, p.66-69.
9. Аkhmetov B.S., Nadeev D.N., Urnev I.V. Serikov I.V. Аpproksimatsiya binomial'nogo zavisimogo zakona
kompozitsiyami normal'nogo, ravnomernogo, arksinusnogo raspredeleniya znachenij M.: Radiotekhnika,
«Nejrokomp'yutery: razrabotka, primenenie», №3, 2012. S. 17-20.
10. Funtikova YU.V., Ivanov А.I., Zakharov O.S. Gipoteza 2 raspredeleniya rasstoyanij KHehmminga dlya
kodov biometricheskoj autentifikatsii primerov obraza «Svoj». Trudy nauchno-tekhnicheskoj konferentsii klastera
penzenskikh predpriyatij, obespechivayushhikh BEZOPАSNOST' INFORMАTSIONNYKH TEKHNOLOGIJ. Penza:
Izd-vo Penzenskogo gos. un-ta, 2014. Tom 9, , s. 7-8., http://www.pniei.penza.ru/RV-conf/T9/S7
Ахметов Б.С., Алимсеитова Ж.К., Серикова Н.И., Иванов А.И., Фунтикова Ю.В.
Тәуелді деректер үшін хи-квадрат критерийінің синтезі
Түйіндеме. Тәуелді деректер үшін хи-квадрат критерийінің синтезі қарастырылады. Тәуелді деректер
ретінде биометриялық бейнелерді қолданады. Биометрияда хи-квадрат критериін статистикалық болжамдарды
тексеру үшін қолданады. Критерийдің синтезін өткізу үшін биометриялық бейнелер қорынан таңдауларды
гистограмма ретінде қолданады.
Түйін сөздер: хи-квадрат критерийі, биометриялық бейне, бостандық дәрежелер саны, тәуелді деректер,
статистикалық болжамдар.
372
Akhmetov B.S., Alimseitova ZH.K., Serikova N.I., Ivanov A.I., Funtikova YU.V.
Synthesis of the chi-square test for dependent data
Summary. The synthesis of the chi-square test for dependent data. The dependent data used biometric images.
In biometrics, chi-square test is used to test statistical hypotheses. To produce synthesis criterion used samples from the
database of biometric images in the form of histograms.
Key words: chi-square test, the biometric image, the number of degrees of freedom, dependent data, statistical
hypothesis.
УДК: 519.7; 519.66; 57.087.1, 612.087.1
Ахметов Б.С.
1
, Иванов А.И.
2
, Малыгин А.Ю.
3
, Качалин С.В.
3
, Сейлова Н.А.
1
1
Казахский национальный технический университет имени К.И. Сатпаева,
г. Алматы, Республика Казахстан
2
Пензенский научно-исследовательский электротехнический институт
3
Пензенский государственный университет
г.Пенза, Российская Федерация
seilova_na@mail.ru
МОРФИНГ-РАЗМНОЖЕНИЕМ ПРИМЕРОВ РОДИТЕЛЕЙ В НЕСКОЛЬКИХ ПОКОЛЕНИЯХ
ПРИМЕРОВ ПОТОМКОВ
Аннотация. Рассматривается задача создания специальных математических приемов, позволяющих
корректно увеличивать размеры обучающей выборки, используемых для обучения искусственных нейронных
сетей. Для заполнения пробелов в гистограмме биометрических данных применяются генетические алгоритмы
размножения примеров, реализованные по ГОСТ Р 52633.2-2010. Показано, что можно отказаться от
использования «мутаций» данных, заменив их более понятной процедурой морфинг-экстраполяции. Даны
условия, при которых применение генетического алгоритма не приводит к сжатию или расширению
многообразия размножаемых биометрических данных.
Ключевые слова: выборка биометрических данных, искусственные нейронные сети, генетические
алгоритмы, морфинг-размножение.
Практика показывает, что маленькие нейронные сети хорошо учатся, но бесполезны, так как
принимаемые ими решения оказываются много хуже, чем решения человека. Большие нейронные
сети очень плохо учатся. Необходимы специальные меры [1,2], делающие алгоритмы обучения
быстрыми и устойчивыми.
Одной из причин неустойчивости множества существующих алгоритмов обучения
искусственных нейронных сетей [1] является ошибка дискретизации непрерывных (континуальных)
биометрических данных, возникающая из-за их представления малым числом примеров в обучающей
выборке. Практика показывает, что стандартный алгоритм обучения [5] начинает хорошо работать
при наличии 20-30 примеров биометрического образа «Свой» в обучающей выборке. В этом
отношении стандартный обучающий автомат [1, 2] работает много хуже, чем учится человек.
Человеку для эффективного обучения достаточно предъявить 2-3 примера одного и того же
биометрического образа «Свой». В этом отношении нейросетевой искусственный интеллект имеет
существенные резервы по снижению размеров обучающей выборки.
В связи с вышеизложенным возникает задача создания специальных математических приемов,
позволяющих корректно увеличивать размеры обучающей выборки, например, скрещиванием
примеров-родителей и получения примеров-потоков по российскому национальному стандарту [2]. В
режиме обучения нейросетевого преобразователя биометрия-код пользователь должен предъявить 21
пример биометрического образа «Свой», из которых затем были извлечены 416 биометрических
параметров 1, 2.
Для
морфинг-размножения
примеров
разобьем
динамический
диапазон
первого
биометрического параметра – v
1
на 10 интервалов, исходя из усредненного 2-кратного попадания
контролируемых значений в каждый из интервалов. Пример одной из получившихся гистограмм
распределения биометрических данных приведен на рисунке 1.
373
Рисунок 1. Получение одного примера-потомка от наиболее далеких примера-родителя-14 и примера-
родителя-18 биометрического образа «Свой»
Из данных рисунка 1 видно, что второй и третий интервалы гистограммы оказались пустыми
(не содержат отсчетов). Необходимо получить новый пример-потомок-22 для которого параметр - v
1
попадет в центр пустующего интервала гистограммы. На рисунке 1 положение синтезированного
примера-потомока-22 отображено квадратом с темной заливкой.
Российский национальный стандарт 2 рекомендует скрещивать наиболее разнесенные (не
похожие) данные. Для первого биометрического параметра наибольшее значение дает 18-пример,
наименьшее значение параметра v
1
дает пример -14. Легко можно вычислить расстояние между
крайними примерами (v
1,18
-v
1,14
), а так же расстояния между примером-потомком-22 и примерами-
родителями. То есть можно вычислить коэффициент похожести потомка-22 на первого и второго
родителя:
18
,
1
14
,
1
22
,
1
18
,
1
1
2
18
,
1
14
,
1
22
,
1
14
,
1
1
v
v
v
v
)
1
(
,
v
v
v
v
(1)
Одним из требований к синтезируемым примерам-потомкам является то, что добавление новых
(синтетических) образов должно сохранять характерные для данных образа «Свой» корреляционные
связи 1 – 7. Этого удается добиться, если синтезировать все данные одного примера с расстояниями
пропорциональными расстояниям по первому параметру – v
1
. Это удается сделать, если образ
потомок всегда располагать между данными примеров-родителей на расстояниях пропорциональных
коэффициентам подобия (1). Пример работы алгоритма такого получения данных для второго
параметра – v
2
приведен на рисунке 2.
Рисунок 2 - Получение примера-потомка от примера-родителя-14 и примера-родителя-18 биометрического
образа «Свой» при наследовании расстояний до родителей от биометрического параметра v
1
374
Расстояние по i-му параметру – v
i
до образа потомка легко вычислимо. Если минимальным
оказывается значениеi-го параметров первого родителя, то для примера-потомка-22 следует задать
значение:
1
18
,
i
14
,
i
14
,
i
22
,
i
v
v
v
v
(2).
Если минимальным оказывается значение i-го параметров второго родителя, то для примера-
потомка-22 следует задать значение:
)
1
(
v
v
v
v
1
18
,
i
14
,
i
18
,
i
22
,
i
(3).
Очевидно, что подобные вычисления можно проделать для каждого из оставшихся 415
параметров примера-потомка-22. Затем мы можем повторить процедуру, синтезировав морфингом
23-тий пример-потомок. При этом нужно построить новые гистограммы для уже имеющихся 22
примеров и ориентироваться на заполнение пустот в любой из гистограмм, исключая первую
гистограмму. Каждый новый искусственный пример-потомок следует создавать, заполняя пробел в
одной из 416 гистограмм. Пользуясь этой тактикой, можно создать дополнительных 416 примеров-
потомков, каждый раз заполняя пробел в какой-то из гистограмм распределения 416-ти параметров.
Практика показала, что пробелы в практически гистограммах исчезают при 30-50 примерах образа
«Свой».
Описанную выше процедуру размножения биометрических данных следует рассматривать как
один из вариантов бутстрап предобработки [8] или многомерную морфинг интерполяцию. Именно
интерполяцию, так как новые данные всегда размещаются между данными примеров-родителей.
ЛИТЕРАТУРА
9.
Волчихин В.И., Иванов А.И., Фунтиков В.А., Назаров И.Г., Язов Ю.К. Нейросетевая защита
персональных биометрических данных. // М.: Радиотехника, 2012., 157 с., ISBN 978-5-88070-044-8.
10. ГОСТ Р 52633.5-2011 «Защита информации. Техника защиты информации. Автоматическое
обучение нейросетевых преобразователей биометрия-код доступа».
11. ГОСТ Р 52633.2-2010 «Защита информации. Техника защиты информации. Требования к
формированию синтетических биометрических образов, предназначенных для тестирования средств
высоконадежной биометрической аутентификации»
12. B. Akhmetov, A. Ivanov, V. Funtikov, I. Urnev Evaluation of Multidimensional Entropy on Short Strings of
Biometric Codes with Dependent Bits. «Progress in Electromagnetics Research Symposium» PIERS Proceedings,
August 19-23, Moscow, RUSSIA 2012, p.66-69.
13. B. Akhmetov, A. Doszhanova, A. Ivanov, T. Kartbaev and A. Malygin “Biometric Technology in Securing
the Internet Using Large Neural Network Technology. World Academy of Science, Engineering and Technology. Issue
79, July, 2013, Singapore, p. 129-138, pISSN 2010-376X, eISSN 2010-3778, www.waset.org.
14. Ахметов Б.С., Надеев Д.Н., Урнев И.В. Сериков И.В. Аппроксимация биномиального зависимого
закона композициями нормального, равномерного, арксинусного распределения значений М.: Радиотехника,
«Нейрокомпьютеры: разработка, применение», №3, 2012. С. 17-20.
15. Ахметов Б.С., Иванов А.И., Урнев И.В., Сериков И.В., Газин А.И. Оценка значений числа степеней
свободы статистик описания выходного кода преобразователя биометрия-код при использовании
распределения
2
, Алматы: Изд-во КазНТУ имени К.И. Сатпаева, http://portal.kazntu.kz/files/publicate/2013-04-
05-elbib.pdf
16. Болл Р.М., КоннелДж.Х., Панканти Ш., Ратха Н.К., Сеньор Э.У. Руководство по биометрии.
Москва: Техносфера, 2007. -368 с., ISBN 978-594836-109-3
REFERENCES
7. Volchihin V.I., Ivanov A.I., Funtikov V.A., Nazarov I.G., Jazov Ju.K. Nejrosetevaja zashhita personal'nyh
biometricheskih dannyh. // M.: Radiotehnika, 2012., 157 s., ISBN 978-5-88070-044-8.
8. GOST R 52633.5-2011 «Zashhita informacii. Tehnika zashhity informacii. Avtomaticheskoe obuchenie
nejrosetevyh preobrazovatelej biometrija-kod dostupa»
9. GOST R 52633.2-2010 «Zashhita informacii. Tehnika zashhity informacii. Trebovanija k formirovaniju
sinteticheskih biometricheskih obrazov, prednaznachennyh dlja testirovanija sredstv vysokonadezhnoj biometricheskoj
autentifikacii»
10. B. Akhmetov, A. Ivanov, V. Funtikov, I. Urnev Evaluation of Multidimensional Entropy on Short Strings of
Biometric Codes with Dependent Bits. «Progress in Electromagnetics Research Symposium» PIERS Proceedings,
August 19-23, Moscow, RUSSIA 2012, p.66-69.
375
11. B. Akhmetov, A. Doszhanova, A. Ivanov, T. Kartbaev and A. Malygin “Biometric Technology in Securing
the Internet Using Large Neural Network Technology. World Academy of Science, Engineering and Technology. Issue
79, July, 2013, Singapore, p. 129-138, pISSN 2010-376X, eISSN 2010-3778, www.waset.org.
12. Ahmetov B.S., Nadeev D.N., Urnev I.V. Serikov I.V. Approksimacija binomial'nogo zavisimogo zakona
kompozicijami
normal'nogo,
ravnomernogo,
arksinusnogo
raspredelenija
znachenij.
M.:
Radiotehnika,
«Nejrokomp'jutery: razrabotka, primenenie», №3, 2012. S. 17-20.
7. Ahmetov B.S., Ivanov A.I., Urnev I.V., Serikov I.V., Gazin A.I. Ocenka znachenij chisla stepenej svobody
statistik opisanija vyhodnogo koda preobrazovatelja biometrija-kod pri ispol'zovanii raspredelenija
2
. Almaty: Izd-vo
KazNTU imeni K.I. Satpaeva, http://portal.kazntu.kz/files/publicate/2013-04-05-elbib.pdf
8. Boll R.M., Konnel Dzh.H., Pankanti Sh., Ratha N.K., Sen'or Je.U. Rukovodstvo po biometrii. Moskva:
Tehnosfera, 2007. -368 s., ISBN 978-594836-109-3
Ахметов Б.С., Иванов А.И., Малыгин А.Ю., Качалин С.В., Сейлова Н.А.
Бірнеше буын ұрпақтар мысалдарында әке-шешенің мысалдарын морфинг-көбейту
Түйіндеме. Жасанды нейрон желілерінің тәлім-тәрбиелері үшін пайдаланатын биометриялық
деректердің талдау көлемінің аумақтауының сұрақтары қарастырылған.
Түйін сөздер: биометриалық деректердің таңдауы, жасанды нейронды желілер, генетикалық
алгоритмдер, морфинг-экстраполяция.
Akhmetov B.S., Ivanov A.I., Malygin A.Yu., Kachalin S.B., Seilova N.A.
Morph-populating the example of parents in several generations examples of descendants
Summary. The problem of increasing sample biometric data used for training artificial neural networks.
Keywords: biometrics, artificial neural networks, genetic algorithms, morph-extrapolation
УДК 519.7+621.394.67
Ахметов Б.С.
1
, Досжанова А.А.
1
, Иванов А.И.
2
, Малыгин А.Ю.
3
1
Казахский национальный технический университет имени К.И. Сатпаева
г. Алматы, Республика Казахстан
2
Пензенский научно-исследовательский электротехнический институт
3
Пензенский государственный университет
г.Пенза, Российская Федерация
Достарыңызбен бөлісу: |