10.5.2. Алгоритм Алгоритм состоит из двух этапов: первого – этапа обучения, во время
которого накапливается информация о признаках на основании уже
имеющегося опыта и оценивается информативность выбранных признаков, и
второго – этапа классификации, на котором выносится решение о
пригодности субъекта к определенной деятельности.
Обучение. Предполагается, что на основании предыдущего опыта
можно выделить группы субъектов «А» и «В», которые отражают наше
понимание пригодности (или непригодности) к данной деятельности и
являются определенными эталонами для дальнейшего прогнозирования
пригодности. Ряд практических вопросов, связанных с образованием классов
«А» и «5», будет рассмотрен ниже. Далее предполагается, что имеется
какой-то набор признаков ν
1
, ν
2
,..., ν
n
,
существенность которых для
определения профессиональной пригодности можно и не знать. Теперь
можно построить множество векторов {ν
Α
}
и {v
B
},
соответственно
характеризующих группы субъектов «А» и «В». Процесс обучения состоит в получении оценки дискрет ных
одномерных распределений вероятностей признаков ν
1
,
ν
2
,...,
ν
n
для класса
«А»:
1
2
1
1
1
,
,...,
n À A A f v f v f v
для класса «В»:
1
2
1
1
1
,
,...,
n B B B f v f v f v
Предполагается, что ν 1 , ν 2 ,..., ν n
слабо зависимы. Если, однако, этого
нет, то для увеличения эффективности процедуры в рассмотрение вводятся
сложные признаки – синдромы, определение которых можно получить на
основании опыта и теоретических соображений или же используя
соответствующий математический аппарат. Построение одномерных
распределений существенно облегчает процесс обучения, а в случае слабой
зависимости потери информации при этом невелики.
Если классы «А» и «В» многочисленны, то можно получить достаточно
хорошую оценку требуемых вероятностей
1
1
A B f v è f v (i=1,2, …,n) В тех же случаях, когда численности классов «А» и «В» невелики,
приходится прибегать к грубому квантованию признаков на 2–3–4 градации.
Практическая проверка показывает, что при наличии в группе 25–30 человек
и соответствующем квантовании можно получить удовлетворительные
результаты.
Полученные в результате обследования данного контингента лиц
показатели могут иметь различную ценность для целей прогнозирования
профессиональной пригодности. Поэтому следующим этапом «обучения»
является оценка информативности признаков.
Признак будет тем более информативным, чем больше различие
между его распределениями у представителей класса «А» и «В». Оценка
информативности признака ν, может выражаться величиной Ρ