Вероятности ошибок а и β определяются до проведения
классификации. При выборе этих вероятностей должна быть учтена
важность той или другой
ошибки классификации, а также реальная ситуация,
возникшая при решении данной конкретной задачи.
Пусть при обследовании субъекта
S были получены признаки
0
0
0
1
2
,
,...,
n
v v
V
(они приведены здесь в порядке их убывающей информативности).
Пусть на основании здравого смысла выбраны допустимые вероятности
ошибок α и β. Рассмотрим отношение вероятностей, соответствующих
первому признаку:
1
0
1
1
0
1
( )
( )
B
A
f v
f v
Если это отношение бeдет меньше чем:
1
то это будет означать, что полученное значение признака
0
1
v
настолько
вероятнее для класса
«А», что можно с выбранным уровнем надежности (α,
β) утверждать, что данное лицо относится к классу «А» (пригодно к данной
профессиональной деятельности). Если это отношение
1
то с тем же уровнем надежности принимается решение о
непригодности к рассматриваемой деятельности.
1
0
1
1
0
1
( )
1
1
( )
B
A
f v
f v
то информация, заключенная в признаке, недостаточна для отнесения
к
классам «А» и «B» и рассматривается следующий признак
0
2
v
Если
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
( )
( )
1
B
B
A
A
f v
f
v
f v
f
v
то выносится решение об отнесении индивида в класс «А» если
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
1
( )
( )
B
B
A
A
f v
f
v
f v
f
v
то в класс «В». Когда же
1
0
2
0
1
2
1
0
2
0
1
2
( )
( )
1
1
( )
( )
B
B
A
A
f v
f
v
f v
f
v
то рассматривается значение третьего признака
0
3
v
и т. д.
Если, перебрав все признаки, не удается отнести субъекта к тому или
иному классу с данным уровнем надежности, то есть рассматриваемое
отношение не выходит за пределы требуемых рубежей, то это означает, что
имеющиеся результаты обследования не позволяют сделать прогноз с
выбранным уровнем надежности. В этих случаях можно понизить этот
уровень и таким образом сделать прогноз или обратиться за
дополнительной информацией.
При отсутствии дополнительной информации для минимизации
вероятности ошибки целесообразно построить два распределения
отношения правдоподобия по всем признакам соответственно для групп
«А»
и
«В» и на основе этих распределений выбрать один порог. Особенности
распределения обычно таковы, что этим порогом редко бывает 1.
Как известно, в схемах последовательного статистического анализа
[58] процедуры обосновываются для однородного случая, когда
1
2
1
2
( )
( )
...
( )
n
A
A
A
n
f v
f
v
f
v
и
1
2
1
2
( )
( )
...
( )
n
B
B
B
n
f v
f
v
f
v
Однако нетрудно показать, что зависимость порогов от вероятности
ошибок α и β переносится и на случай неоди наковых распределений,
возникающих в
диагностической задаче.
Практически удобно иметь дело не с отношениями вероятностей, а с
логарифмом этого отношения. Тогда все вычисления сводятся к
последовательному сложению.
Итак, определение принадлежности векторов ν (
ν
1
, ν
2
,..., ν
n
)
к
множеству
{ν
Α
}
или
{ν
Β
}
осуществляется
следующим
образом.
Последовательно вычисляются величины
L
1
L
2
,..., L
k
,
где:
1
( )
, a
lg
( )
j
k
B
j
k
j
j
j
j
A
j
f
v
L
R
R
f
v
Каждое вычисленное L
k
сравнивается с порогами
1
è
1
Если пр некотором k
1
1
k
L
То вычисляется L
k+1
.
Если же
1
k
L
То
B
v
v
;
если же
1
k
L
Достарыңызбен бөлісу: