Учебное пособие для вузов м пер сэ, 2001 511 с (Современное образование). Учебное пособие содержит материалы экспериментально-теоретического изучения психологических

жүктеу/скачать 2,63 Mb.

Pdf көрінісі

бет	99/128
Дата	09.05.2022
өлшемі	2,63 Mb.
	#33122
түрі	Учебное пособие

1 ... 95 96 97 98 99 100 101 102 ... 128

Байланысты:
bodrov psy prof

j

–
вероятностью  того,  что  распределения
 
 

j
j
À
j
B
j
f
v è f
v

различны.  Это
достигается при помощи вычисления χ
2
.
Интуитивно ясно, что вероятность Ρ
может  быть  хорошей  мерой  информативности  признака  ν  при  данной
конкретной
классификации.
Необходимо
отметить,
что
признаки,
информативные
в
одном
случае,
могут
оказаться
совсем
не
информативными для решения задачи профотбора других специалистов.

( )
( )
2
( )
( )
( )
( )
( )
( )
1
1
j
S
j
j
j
j
i
i
j
A
B
j
j
j
j
i
i
i
A
B
A
B
N
N
A
B
N
N





















Вычисление с
2

производилось по формуле:
где
( )
j
A
N
и
( )
j
B
N
–  общее  число  лиц  соответственно  в  классах  «А»  и  «В»,
данные  которых  использовались  при  построении  распределений  для  j-го
признака;
( )
j
i
A

и
( )
j
i
B
– частоты появления индивидов в i-йрадации j-го признака
для сравниваемых классов; S – число градаций для j-го признака.
Вероятности
Ρ
j
пределялись  по  таблицам  Л.  Большова  и  Н.  Смирнова
[52].  Оценка  информативности  может  быть  также  получена  и  при  помощи
расстояния  Кульбака.  В  принятых  здесь  обозначениях  и  несколько
измененной форме это расстояние имеет вид:
A
B
j
j
j
I
I
I



где
1
lg
j
s
j
j
j
A
i
i
B
j
j
j
j
i
A
i
A
A
A
N
I
N
B
N












и
1
lg
j
s
j
j
j
B
i
i
B
j
j
j
j
i
B
i
A
B
A
N
I
N
B
N












Эта  мера  имеет  ряд  преимуществ,  особенно  при  теоретических
исследований.  Для  практики  представляет  интерес  возможность  измерения
значимости  признаков
ν
1
(j=  1,  2,...,n
)  отдельно  для  вынесения  решения  о
принадлежности
ν

к {ν
Α
}
или {v
B
}
(соответственно слагаемые
A
j
I

и
B
j
I
).
Используя  ту  или  другую  меру,  признаки  целесообразно  расположить
по их  убывающей информативности, а те из них, которые неинформативны
(Р слишком велико или I -  мало), использовать не надо. Если окажется, что
информативных  признаков  осталось  мало,  то  необходимо  ввести  новые
признаки.
Процесс  «обучения»  можно  считать  законченным,  когда  оценки
распределений
( )
A
j
j
f
v

и
( )
B
j
j
f
v

(j=  1,  2,  ...,  n)
достаточно  надежны,  признаки
упорядочены по их информативности и их достаточно много.

Классификация  (решающее  правило).  При  классификации  можно
допустить две ошибки. Субъект из класса «А» может быть ошибочно отнесен
к  классу  «B»  и,  наоборот,  субъект  из  класса  «B»  может  быть  ошибочно
причислен к классу «А». Первую из указанных ошибок классификации будем
обозначать через α, а вторую через β.

Вероятности  ошибок  а  и  β  определяются  до  проведения
классификации.  При  выборе  этих  вероятностей  должна  быть  учтена
важность той или другой ошибки классификации, а также реальная ситуация,
возникшая при решении данной конкретной задачи.

Пусть  при  обследовании  субъекта  S  были  получены  признаки
0
0
0
1
2
,
,...,
n
v v
V
(они приведены здесь в порядке их убывающей информативности).
Пусть  на  основании  здравого  смысла  выбраны  допустимые  вероятности
ошибок  α  и  β.  Рассмотрим  отношение  вероятностей,  соответствующих
первому признаку:

1
0
1
1
0
1
( )
( )
B
A
f v
f v

Если это отношение бeдет меньше чем:
1




то это будет означать, что полученное значение признака
0
1
v

настолько
вероятнее для класса «А», что можно с выбранным уровнем надежности (α,
β)  утверждать,  что  данное  лицо  относится  к  классу  «А»  (пригодно  к  данной
профессиональной деятельности). Если это отношение
1





то  с  тем  же  уровнем  надежности  принимается  решение  о
непригодности к рассматриваемой деятельности.
1
0
1
1
0
1
( )
1
1
( )
B
A
f v
f v









то информация, заключенная в признаке, недостаточна для отнесения
к классам «А» и «B» и рассматривается следующий признак
0
2
v

Если
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
( )
( )
1
B
B
A
A
f v
f
v
f v
f
v







то выносится решение об отнесении индивида в класс «А» если
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
1
( )
( )
B
B
A
A
f v
f
v
f v
f
v







то в класс «В». Когда же
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
1
1
( )
( )
B
B
A
A
f v
f
v
f v
f
v











то рассматривается значение третьего признака
0
3
v

и т. д.
Если, перебрав все признаки, не удается отнести субъекта к тому или
иному  классу  с  данным  уровнем  надежности,  то  есть  рассматриваемое
отношение не выходит за пределы требуемых рубежей, то это означает, что
имеющиеся  результаты  обследования  не  позволяют  сделать  прогноз  с
выбранным  уровнем  надежности.  В  этих  случаях  можно  понизить  этот
уровень  и  таким  образом  сделать  прогноз  или  обратиться  за
дополнительной информацией.
При  отсутствии  дополнительной  информации  для  минимизации

вероятности  ошибки  целесообразно  построить  два  распределения
отношения правдоподобия по всем признакам соответственно для групп «А»
и  «В»  и  на  основе  этих  распределений  выбрать  один  порог.  Особенности
распределения обычно таковы, что этим порогом редко бывает 1.
Как  известно,  в  схемах  последовательного  статистического  анализа
[58] процедуры обосновываются для однородного случая, когда
1
2
1
2
( )
( )
...
( )
n
A
A
A
n
f v
f
v
f
v

 

и
1
2
1
2
( )
( )
...
( )
n
B
B
B
n
f v
f
v
f
v

 

Однако  нетрудно  показать,  что  зависимость  порогов  от  вероятности
ошибок  α  и  β  переносится  и  на  случай  неоди  наковых  распределений,
возникающих в диагностической задаче.
Практически  удобно  иметь  дело  не  с  отношениями  вероятностей,  а  с
логарифмом  этого  отношения.  Тогда  все  вычисления  сводятся  к
последовательному сложению.
Итак,  определение  принадлежности  векторов  ν  (ν
1
,  ν
2
,...,  ν
n
)
к
множеству
{ν
Α
}
или
{ν
Β
}
осуществляется
следующим
образом.
Последовательно вычисляются величины L
1
L
2
,..., L
k
,
где:

1
( )
,  a
lg
( )
j
k
B
j
k
j
j
j
j
A
j
f
v
L
R
R
f
v





Каждое вычисленное L
k
сравнивается с порогами
1
è
1







Если пр некотором k1
1
k
L









То вычисляется L
k+1
.
Если же
1
k
L





То
 
B
v
v

;
если же
1
k
L





жүктеу/скачать 2,63 Mb.

Достарыңызбен бөлісу:

1 ... 95 96 97 98 99 100 101 102 ... 128